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语句 进行 日 期 处 理 ， 以 及 一 些 其 他 的 SQL 语句 查询 操作 ， 能 够 帮助 你 掌握 相关 的 SQL 知识 。 

本 书 适用 于 SQL FRAR, dE SQL 程序 员 和 SQL 专家 , 以 及 想 要 学 习 SQL 技术 的 初学 者 。 
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SQL 是 数据 库 世 界 的 语言 。 如 果 你 从 事 与 关系 数据 库 相 关 的 开发 工作 或 者 数据 报表 工作 ， 
那么 把 数据 在 入 数据库 并 将 其 再 次 读 取出 来 的 能 力 最 终 取决 于 你 所 具备 的 SQL 知识 。 然 
而 ， 许 多 数据 库 从 业 人 员 只 是 粗浅 地 使 用 SQL， 并 不 了 解 其 强大 的 数据 处 理 能 力 。 本 书 致 
力 于 改变 这 种 状况 ， 告 诉 你 SQL 真正 能 帮 你 做 些 什么 。 
你 手 里 的 这 本 书 像 一 本 菜谱 ， 它 包含 了 一 系列 常见 的 SQL 问题 及 其 解决 方案 。 我 希望 它 能 
对 你 的 日 常 工作 有 所 帮助 。 我 按照 主题 组 织 章节 ， 当 你 遇 到 一 个 不 好 解决 的 SQL 问题 时 ， 
请 查找 最 相近 的 章节 。 浏 览 一 下 各 节 的 标题 ， 你 很 可 能 会 找到 解决 思路 ， 或 至 少 得 到 一 些 
启发 。 

本 书 汇集 了 150 多 个 实例 ， 篇 幅 达 500 多 页 。 然 而 ， 这 样 的 篇 幅 仅仅 展示 了 SQL 实际 能 力 
的 一 个 侧面 。 我 们 为 日 常 的 编程 问题 找到 了 不 同 的 SQL 解决 方案 ,但 其 数量 远 未 及 问题 
的 数量 。 本 书 并 不 打算 集 齐全 部 SQL 编程 问题 。 事 实 上 ， 那 样 做 徒劳 无 功 。 相 反 ， 你 能 
在 书 中 找到 许多 常见 问题 的 解决 方案 ， 从 中 学 到 的 技术 将 有 助 于 拓宽 你 的 思路 并 用 于 解决 
新 问题 。 
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` 出 版 社 和 我 本 人 持续 关注 那些 新 的 、 有 价值 的 SQL 解决 方案 。 如 果 你 对 某 个 
p^ , SQL 问题 有 聪明 的 解决 办 法 ， 不 妨 分 享 出 来 ， 或 许 我 会 将 其 加 入 本 书 的 下 一 
入 ,版 。 可 以 在 “联系 我 们 ”一 节 找 到 我 们 的 联系 方式 。 


为 何 写作 本 书 


查询 、 查 询 ， 还 是 查询 。 我 最 初 的 目标 是 写 一 本 讲解 SQL 查询 技术 的 书 ， 而 不 是 现在 的 这 
本 涵盖 范围 如 此 广泛 的 SQL 实例 集 。 一 开始 ， 我 专注 于 解释 各 种 SQL 查询 ， 从 相对 简单 
的 语 名 起步 ， 逐 步 过渡 到 比较 复杂 的 部 分 ， 我 盼望 你 能 掌握 其 中 的 技巧 ， 进 而 运用 它们 解 
决 工作 中 过 到 的 实际 问题 。 我 希望 能 把 多 年 职业 生涯 中 积累 的 许多 SQL 编程 技巧 传授 给 
你 ， 和 希望 你 能 从 中 学 到 知识 ， 得 到 启发 ， 最 终 找 到 更 好 的 解决 方案 。 我 相信 在 这 个 过 程 中 
你 我 彼此 都 会 受益 良 多 。 从 数据 库 里 读 取 数 据 看 起 来 简单 至 极 ， 然 而 在 IT 的 世界 里 尽 可 
能 高 效 地 实现 数据 检索 却 是 至 关 重 要 的 事情 。 关 于 高 效 检索 的 技术 应 该 被 广泛 地 分 享 和 传 
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播 ， 这 样 能 提升 所 有 人 的 效率 ， 使 大 家 互 帮 互 助 。 


想 想 为 数学 做 出 杰出 贡献 的 格 奥 尔 格 ' 康 托 尔 ， 他 最 先 意识 到 把 一 组 元 素 作为 整体 来 研究 
有 着 重大 意义 〈 即 研究 集合 本 身 ， 而 不 是 研究 各 个 构成 要 素 )。 最 初 ， 康 托 尔 的 工作 并 不 
为 数学 界 所 接受 。 然 而 现在 ， 大 家 不 仅 接受 了 它 ， 甚 至 认为 集合 论 是 数学 的 基础 ! 更 重要 
的 是 ， 集 合 论 能 有 今天 的 面 角 ， 并 非 仅 仅 得 益 于 康 托 尔 一 个 人 的 研究 工作 ， 通 过 向 同行 分 
享 研 究 成 果 ， 其 他 诸如 Ernst Zermelo、Gottlob Frege, Abraham Fraenkel, Thoralf Skolem, 
Kurt Gódel 和 John von Neumann 等 数学 家 进一步 发 展 和 改进 了 集合 论 。 分 享 不 仅 让 大 家 更 
好 地 理解 了 康 托 尔 的 研究 工作 ， 也 造就 了 更 完善 的 集合 论 。 


本 书 的 目标 


本 书 的 终极 目标 是 带领 你 看 看 SQL 除了 解决 典型 的 问题 之 外 ， 还 能 做 些 什 么 。 在 这 些 年 
里 ，SQL 获得 了 长 足 的 发 展 。 过 去 我 们 通常 使 用 C 或 者 Java 等 过 程 化 编程 语言 才能 解决 
的 问题 ， 现 在 已 经 可 以 直接 用 SQL 解决 了 ， 而 许多 开发 人 员 却 对 此 一 无 所 知 。 本 书 将 带 你 
学 习 这 些 方面 的 SQL 技术 。 


不 过 ， 为 了 避免 你 误解 上 述 文 字 ， 我 要 声明 ， 我 真心 赞同 一 名 老话 :“ 如 果 东 西 没 坏 ， 就 
别 修 理 。” 举 例 而 言 ， 假 定 有 一 个 具体 的 业务 问题 要 解决 ， 你 先 用 SQL 从 数据 库 里 取出 了 
原始 数据 ， 然 后 用 其 他 编程 语言 写 程序 ， 并 实现 了 一 些 复杂 的 业务 逻辑 处 理 。 如 果 你 的 代 
码 工 作 正常 并 且 运 行 起 来 性 能 也 不 错 ， 那 么 ， 保 持 现状 就 很 好 。 我 不 会 从 四 你 去 实现 一 个 
“ 纯 SQL 解决 方案 ”， 我 只 是 希望 你 能 意识 到 ， 今 天 的 SQL 不 同 于 1995 年 的 SQL。 今天 
的 SQL 实际 上 能 做 更 多 的 事情 。 


本 书 的 读者 对 象 


本 书 的 独特 之 处 在 于 ， 它 面向 广泛 的 读者 群 ， 且 最 终 呈现 出 来 的 内 容 保持 了 高 品质 。 我 在 
书 中 同时 提供 了 复杂 的 和 简单 的 实例 ， 如 果 某 个 问题 设 有 通用 的 解决 办 法 ， 我 会 针对 不 同 
的 数据 库 产 品 提 供 多 种 方案 供 你 选择 。 因 此 本 书 的 目标 读者 群 确实 是 广泛 的 。 


。 SQL 初学 者 : 或 许 你 买 了 一 本 教材 ， 想 开始 学 习 SQL; 或 许 你 刚 开 始 上 第 一 个 学 期 的 
数据 库 必 修 课 ， 想 通过 研究 实例 巩固 课堂 所 学 。 你 可 能 看 到 过 有 人 用 区 区 一 条 查询 语句 
就 神奇 地 把 行 形式 的 数据 转换 成 了 列 形式 ， 或 者 把 某 个 长 字符 串 拆 解 成 了 一 组 结果 集 。 
本 书 收录 的 众多 实例 将 解释 上 述 这 些 神奇 查询 背后 的 技术 。 

。 非 SQL 程序 员 : 或 许 你 有 其 他 语言 的 编程 经 验 ， 而 当前 的 工作 急需 你 掌握 别 的 同事 留 
下 的 一 些 复杂 的 SQL.。 本 书 列 出 的 实例 (尤其 是 后 面 几 章 ) 会 把 复杂 的 查询 一 一 分 解 开 来 ， 
帮 你 循序 渐进 地 理解 复杂 的 代码 。 

。 SQL 开发 人 员 : 对 于 中 级 SQL 开发 人 员 ， 本 书 是 你 梦 栾 以 求 的 进 阶 灵丹妙药 。( 好 吧 ， 
这 话说 得 太 大 了 。 请 原谅 一 位 作者 对 作品 的 自信 。) 如 果 你 从 很 久 以 前 就 开始 用 SQL 编 
程 了 ， 并 且 想 开始 学 习 窗 口 国 数 ， 那 么 本 书 尤 其 适合 你 。 举 例 来 说 ， 你 不 再 需要 把 中 间 
计算 结果 存 入 临时 表 ， 有 了 窗口 函数 ， 你 只 要 一 个 SQL 查询 就 能 得 出 结果 。 我 要 再 次 
声明 ， 我 并 不 是 在 勉强 你 接受 我 的 观点 。 但 是 ， 如 有 果 你 还 没有 适时 跟 进 SQL 语言 最 新 
的 变化 ， 请 借助 本 书 更 新 你 的 技能 。 
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Xii Bm 


SQL 专家 : 毫 无 疑问 , 你 早已 经 掌握 了 书 中 的 技巧 , 其 至 已 经 能 够 加 以 变化 、 灵 活 运 用 。 
那么 ， 本 书 对 你 是 否 还 有 帮助 呢 ? 也 许 你 精通 SQL Server， 想 要 了 解 Oracle; 也 许 你 只 
用 过 MySQL， 又 想 知 道 同 样 的 技术 在 PostgreSQL 上 是 如 何 应 用 的 。 本 书 涉及 多 个 不 
同 的 关系 数据 库 管 理 系统 ， 分 别 展示 了 针对 不 同 产品 的 实例 。 这 是 你 拓宽 知识 领域 的 好 
机 会 。 


























如 何 使 用 本 书 


请 一 定 认 真 通读 前 言 部 分 。 它 包含 了 一 些 必要 的 背景 知识 及 其 他 信息 ， 这 为 后 续 的 内 容 做 
了 适当 的 铺垫 。 “平台 和 版 本 ”一 节 会 告诉 你 本 书 涉 及 哪些 关系 数据 库 管理 系统 。 尤 其 要 
看 一 下 “本 书 中 用 到 的 表 ” 一 节 ， 这 样 你 会 熟悉 后 续 章 节 里 反复 出 现 的 数据 表 样 例 。 你 也 
会 在 “本 书 使 用 的 约定 ”一 节 中 看 到 一 些 重要 的 代码 和 字体 风格 约定 。 上 述 内 容 都 是 前 言 
的 组 成 部 分 。 

注意 ， 这 是 一 本 SQL 实例 集 ， 它 用 一 系列 的 代码 实例 来 帮助 你 解决 你 可 能 会 遇 到 的 相似 
或 者 相同 的 问题 。 请 不 要 试图 通过 本 书 学 习 SQL 语法 和 基本 知识 ， 至 少 它 不 适合 那些 对 
SQL 一 无 所 知 的 读者 。 本 书 适 合作 为 补充 材料 ， 而 不 能 替代 通常 的 SQL 教科 书 。 除 此 之 
外 ， 下 述 要 点 能 帮 你 更 好 地 利用 本 书 。 







































































本 书 中 用 到 了 一 些 数据 库 厂商 提供 的 函数 。 如 果 你 不 了 解 这 些 函 数 ， 不 妨 参 考 Jonathan 
Gennick 的 著作 SOL Pocket Guide ， 该 书 详细 解释 了 这 些 函 数 。 

如 果 你 不 曾 使 用 过 窗口 函数 ， 或 者 不 熟悉 GROUP BY 查询 ， 请 先 阅读 附录 A。 该 附录 讲 
解 了 SQL 的 分 组 概念 和 做 法 ， 它 也 展示 了 窗口 函数 的 工作 原理 。 窗 口 函 数 的 引入 是 
SQL 最 为 重要 的 进展 之 一 。 
请 尊重 常识 ! 务必 了 解 ， 本 书 不 可 能 涵盖 你 在 工作 中 可 能 遇 到 的 全 部 问题 。 你 要 做 的 是 
把 本 书 提供 的 实例 作为 模板 或 者 指南 ， 灵 活 运用 必要 的 技术 来 解决 你 遇 到 的 问题 。 你 
可 能 会 这 样 说 :“ 太 棒 了 ! 这 个 例子 适用 于 这 种 特定 的 数据 集 ， 但 我 遇 到 的 问题 与 此 不 
同 ， 以 至 于 无 法 照搬 。” 在 这 种 情况 下 ， 你 应 该 试 着 找到 两 者 之 间 的 共性 。 把 书 中 的 查 
询 语 句 拆 解 开 来 ， 先 提取 出 最 基本 的 形式 ， 然 后 根据 需要 逐步 增加 难度 。 任 何 查询 都 从 
SELECT.. .FROM... 这 种 基本 形式 起 步 。 如 果 你 在 它 的 基础 上 逐步 地 添砖加瓦 ， 每 次 增加 
一 个 新 的 查询 项 、 函 数 或 连接 查询 ， 你 就 不 仅 能 充分 理解 每 个 动作 会 如 何 影响 最 终 的 结 
果 集 ， 也 能 了 解 书 中 的 实例 与 你 的 实际 需求 之 间 有 何 种 差异 。 最 后 ， 你 就 能 修改 这 些 实 
例 ， 使 其 适用 于 你 自己 的 数据 集 。 

测试 、 测 试 ， 再 测试 。 本 书 中 反复 出 现 的 EMP 表 只 有 14 行 ， 毫 无 疑问 ， 你 在 工作 中 遇 
到 的 任何 一 张 表 都 可 能 比 它 大 。 因 此 ， 我 建议 用 你 自己 的 数据 来 测试 书 中 的 查询 ， 至 少 
要 保证 它们 工作 正常 。 我 没有 办 法 了 解 你 的 表 长 什么 样 ， 有 哪些 索引 ， 和 其 他 表 存 在 何 
种 关联 。 因 此 ， 除 非 你 全 面 地 理解 了 书 中 的 查询 技巧 以 及 把 它们 应 用 到 你 的 数据 里 会 有 
什么 样 的 结果 ， 否 则 请 不 要 盲目 地 将 它们 应 用 于 生产 环境 的 代码 。 

大 胆 尝试 ， 勇 于 创新 。 我 鼓励 你 大 胆 尝 试 本 书 未曾 提 及 的 那些 技巧 和 做 法 。 虽 然 我 在 书 
中 刻意 使 用 了 不 同 数据 库 的 许多 函数 ， 但 通常 而 言 ， 还 有 别 的 函数 也 同样 适用 于 解决 某 
个 问题 。 因 此 ， 请 大 胆 改写 书 中 提供 的 代码 ， 演 化 出 你 自己 的 版 本 。 






































































































































新 东西 不 一 定 更 好 。 如 果 你 的 代码 里 没有 用 到 新 近 引 入 的 SQL 语言 特性 ， 并 不 意味 着 
引入 之 后 它 会 变 得 更 有 效率 。 在 很 多 情况 下 ， 传 统 的 做 法 可 能 和 新 方案 一 样 好 ， 甚 至 更 
好 。 请 记 住 这 一 点 ， 尤 其 是 在 阅读 附录 B 的 时 候 。 读 过 本 书 以 后 ， 请 不 要 认为 你 必须 
更 新 或 者 修改 所 有 的 旧 代码 。 你 只 需要 认识 到 ，SQL 相 比 20 年 前 添加 了 许多 新 的 、 非 
常 好 的 功能 ， 而 它们 值得 你 花 时 间 去 学 习 。 

不 要 害怕 复杂 的 查询 。 如 有 果 你 发 现 某 个 查询 看 起 来 太 复杂 ， 以 至 于 暂时 无 法 理解 ， 不 要 
害怕 。 当 讲解 一 个 问题 时 ， 我 已 经 不 遗 余力 地 分 解 每 一 个 查询 ， 从 最 简单 的 形式 开始 逐 
级 变化 ， 直 至 呈现 出 完整 的 解法 ， 我 甚至 列 出 了 每 个 中 间 步 又 的 执行 结果 。 你 可 能 没 办 
法 立刻 纵 观 全 局 ， 但 只 要 跟着 我 的 思路 走 下 去 ， 不 仅 能 够 理解 查询 语句 是 如 何 被 构造 出 
来 的 ， 也 能 看 到 中 间 的 每 一 步 会 得 到 什么 样 的 结果 。 最 终 ， 你 会 发 现 那些 复杂 的 查询 并 
不 难 理解 。 
在 必要 的 时 候 进 行 防 御 式 编程 。 为 了 让 本 书 中 出 现 的 查询 尽量 简洁 易 懂 ， 我 去 除了 代码 
里 的 许多 防御 性 措施 。 以 一 个 计算 员工 薪酬 总 和 的 查询 为 例 。 一 种 可 能 出 现 的 情况 是 ， 
表示 薪酬 的 字段 被 定义 成 了 VARCHAR 类 型 ， 以 至 于 存 入 数据库 的 可 能 是 混合 了 数字 和 字 
符 串 的 数据 。 我 在 书 中 给 出 的 代码 并 设 有 提防 这 种 情况 〈 因 此 ，SuUN 函数 因 无 法 处 理 字 
符 数 据 而 导致 执行 失败 )。 如 果 你 遇 到 了 这 样 的 数据 (更 准确 地 说 是 “这 样 的 问题 ”)， 
就 需要 通过 额外 的 代码 做 一 些 防范 处 理 ， 或 者 把 不 规范 的 数据 整理 好 ， 因 为 本 书 中 给 出 
的 查询 并 没有 考虑 这 种 数字 和 字符 混合 出 现 的 情况 。 我 的 观点 是 ， 略 去 这 类 琐 雁 的 细 站 
有 助 于 你 聚焦 正题 ， 专 注 理解 查询 技术 。 

反复 练习 最 重要 。 掌 握 查 询 的 最 佳 办 法 是 亲自 动手 编程 。 阅 读 代码 自然 大 有 神 益 ， 但 动 
手 练习 是 更 好 的 做 法 。 你 当然 要 先 读 懂 那 些 查 询 并 了 解 其 工作 原理 ， 但 最 终 只 有 通过 动 
手 实 践 才能 自己 写 出 查询 。 











































































































注意 ， 本 书 中 的 很 多 例子 都 是 人 为 设计 的 。 然 而 ， 问 题 本 身 都 来 自 真实 世界 ， 并 非 人 为 腾 
造 。 我 只 不 过 围绕 着 一 小 组 包含 了 雇员 数据 这 样 的 表 来 构造 实例 。 我 尽力 帮 你 先 熟悉 示例 
数据 ， 这 样 你 就 能 把 广 意 力 放 在 每 一 个 实例 背后 的 技术 细节 上 。 面 对 某 个 具体 问题 时 ， 你 
可 能 会 说 :“ 我 不 需要 针对 雇员 数据 做 这 些 查 询 。 这 时 请 忽略 示例 数据 ， 聚 焦 于 我 为 你 演 
示 的 那些 技术 。 技 术 是 通用 的 。 我 和 我 的 同事 天 天 都 在 用 同样 的 技术 解决 不 同 的 问题 。 我 
们 相信 你 也 是 这 样 。 


本 书 不 会 涉及 的 内 容 


由 于 时 间 和 篇 幅 限 制 ， 一 本 书 无 法 陡 括 你 可 能 实际 遇 到 的 所 有 SQL 问题 及 其 解决 办 法 。 以 
下 是 本 书 不 会 涉及 的 内 容 。 












































数据 定义 。 本 书 不 会 涉及 诸如 创建 索引 、 添 加 约束 、 加 载 数 据 等 SQL 操作 ， 这 一 类 操 
作 的 语法 多 数 会 因数 据 库 的 不 同 而 呈现 出 较 大 差异 ,因此 你 最 好 多 参考 官方 手册 。 另 外 ， 
这 类 任务 的 难度 还 没有 达到 那 种 需要 专门 买 一 本 书 来 寻求 解决 方案 的 程度 。 尽 管 如 此 ， 
第 4 章 还 是 提供 了 一 些 涉 及 数据 的 插入 、 更 新 和 删除 等 常见 问题 的 实例 。 
XML。 我 一 向 认为 ， 与 XML 相关 的 例子 不 应 该 出 现在 SQL 书 里 。 把 XML 文档 存 入 关 
系数 据 库 正 变 得 越 来 越 常见 ， 以 至 于 许多 关系 数据 库 管理 系统 都 提供 了 专 有 的 扩展 和 工 
有 具 帮 助 大 家 获取 和 处 理 XML 数据 。 处 理 XML 通常 需要 一 些 过 程 化 的 程序 代码 ， 因 此 






























































不 在 本 书 讨论 范围 之 内 。XQUERY 等 技术 完全 独立 于 SQL， 应 该 会 有 专门 讲解 这 一 类 
技术 的 书 。 

。 SQL 的 面向 对 象 扩展 。 除 非 出 现 更 适合 处 理 对 象 的 语言 ， 否 则 我 不 赞成 在 关系 数据 库 
里 使 用 面向 对 象 特性 和 设计 。 当 前 一 些 数据 库 实现 了 部 分 面向 对 象 特性 ， 不 过 它们 更 适 
用 于 过 程 化 程序 设计 ， 而 非 SQL 固有 的 面向 集合 的 问题 解决 方式 。 

。 理论 层面 的 争论 。 你 不 会 在 本 书 中 看 到 诸如 SQL 是 不 是 关系 型 编程 语言 ， 或 者 Nutt 是 
否 应 该 存在 等 这 一 类 观点 。 我 把 注意 力 集中 在 来 自 真实 世界 的 SQL KAL, MWER 
的 讨论 不 见于 本 书 。 要 解决 一 个 问题 ， 你 必须 对 现 有 的 工具 善 加 利用 。 你 只 能 拥抱 现 有 
的 一 切 ， 而 不 应 该 对 那些 可 望 不 可 及 的 东西 念念不忘 。 

we 一 ] ”如 果 你 希望 学 习 更 多 理论 知识 ，Chris Date 的 “关系 数据 库 论 文集 ”系列 里 

QS 4， 的 任何 一 本 书 都 会 是 一 个 非常 好 的 起 点 。 你 也 可 以 去 读 他 的 著作 《深度 探索 

必 ， 关 系数 据 库 》。 


。 数据 库 优 劣 之 争 。 本 书 提供 的 实例 兼顾 5 种 关系 数据 库 管理 系统 。 你 自然 想 知道 哪 种 数 
据 库 提供 的 方案 最 好 或 最 快 。 每 一 家 数据 库 厂商 都 能 给 出 足够 多 的 资料 来 证 明 自 己 的 产 
品 才 是 最 好 的 ， 我 不 想 在 这 里 论 及 此 事 。 

。 数据 库 标 准 之 争 。 许 多 书 都 有 意 回避 不 同 数据 库 厂 商 提 供 的 专 有 函数 ， 本 书 却 热情 拥抱 
这 些 专 有 函数 。 我 不 会 仅仅 出 于 对 可 移植 性 的 芳 虑 去 写 一 些 复杂 低 效 的 SQL 代码 。 我 
从 来 没有 见 过 哪 一 家 公司 明令 禁止 使 用 专 有 的 扩展 。 你 付 钱 买 了 这 些 特性 ， 为 什么 不 善 
用 它们 ? 
数据 库 厂 商 的 专 有 扩展 之 所 以 存在 ， 自 有 其 原因 。 相 较 于 标准 SQL， 专 有 扩展 往往 能 
提供 更 高 的 执行 效率 和 更 强 的 代码 可 读 性 。 如 果 你 喜欢 写 完全 符合 ANSI 标准 的 代码 ， 
那 也 很 好 。 正 如 我 之 前 提 到 的 ， 我 并 不 是 要 你 去 将 现 有 代码 改 个 底 朝 天 。 如 果 你 的 代码 
严格 符合 ANSI 标准 并 且 工 作 得 很 好 ， 那 也 很 棒 。 归 根 结 底 ， 我 们 都 要 工作 ， 都 要 支付 
账单 ， 并 且 都 想 早 点 下 班 回 家 以 享受 每 天 的 剩余 时 光 。 因 此 ， 我 并 不 是 在 暗示 纯 标准 化 
的 做 法 有 问题 。 让 代码 跑 起 来 才 是 最 重要 的 事 。 但 是 ， 我 需要 声明 ， 如 果 你 在 寻找 纯 标 
准 化 的 解决 方案 ， 那 就 不 应 该 阅读 本 书 。 

。 遗留 系统 之 争 。 本 书 提供 的 实例 用 到 了 写作 本 书 时 已 经 可 用 的 数据 库 新 特性 。 如 果 你 还 
在 使 用 某 些 旧版 本 的 关系 数据 库 管理 系统 ， 我 提供 的 解决 方案 有 许多 可 能 都 无 法 适用 。 
技术 不 会 停 沸 不 前 ， 你 也 不 应 该 墨守成规 。 如 果 你 需要 找到 针对 旧版 关系 数据 库 管理 系 
统 的 解决 方案 ， 可 以 翻 翻 多 年 前 的 SQL 书 ， 它 们 已 经 提供 了 足够 多 的 例子 。 


本 书 的 结构 


本 书包 括 14 章 和 两 个 附录 。 


。 第 1 章 介绍 非常 基本 的 查询 语句 。 示 例 包 括 如 何 使 用 WHERE 子 句 筛选 结果 集 ， 为 结果 集 

里 的 列 取 别 名 ， 通 过 内 和 骨 视 图 实现 别名 列 引 用 ， 使 用 简单 的 条 件 逻 辑 ， 限 制 单个 查询 返 
回 的 记录 行 数 ， 随 机 返回 记录 行 ， 以 及 检索 Null 值 。 大 多 数 示例 都 非常 简单 ， 但 部 分 
示例 会 再 次 出 现在 后 续 较 为 复杂 的 实例 里 。 如 果 你 是 SQL 新 手 或 者 对 这 些 用 法 不 太 熟 
悉 ， 那 么 应 该 好 好 读 一 读 这 一 章 的 内 容 。 




































































































































































< cA | 


By 吾 XV 




















第 2 章 提供 了 一 些 查询 结果 排序 的 实例 。 这 一 章 介 绍 了 ORDER BY 子 句 ， 并 将 其 用 于 查 
询 结果 排序 。 示 例 的 难度 逐步 增加 ， 从 简单 的 单列 排序 到 按照 子 字符 串 排序 ， 再 到 按照 
条 件 表 达 式 排序 。 

第 3 章 通 过 一 些 实 例 来 演示 如 何 合 并 多 个 表 的 数据 。 如 果 你 是 SQL 新 手 或 不 熟悉 连接 
查询 ， 我 强烈 建议 你 在 阅读 第 5 章 及 后 续 章 节 之 前 先 读 一 读 这 一 章 的 内 容 。 连 接 查 询 几 
平 就 是 SQL 的 全 部 内 容 ， 要 学 会 SQL， 你 必须 理解 连接 查询 。 这 一 章 的 示例 包括 执行 
内 连接 和 外 连接 ， 识 别 币 卡 儿 积 ， 执 行 基 本 的 集合 操作 (Ek, HR, ZR), URE 
连接 查询 中 使 用 聚合 函数 。 
第 4 章 分 别提 供 了 一 些 关于 插入 、 更 新 和 删除 数据 的 实例 。 它 们 中 的 大 多 数 都 很 直 截 了 
(甚至 可 能 让 你 觉得 乏味 )。 然 而 ， 有 一 些 操作 可 能 对 你 非常 有 用 ， 比 如 把 一 个 表 的 
若干 行 插入 另 一 个 表 ， 更 新 数据 时 使 用 关联 子 查询 ， 理 解 Null 值 的 作用 ， 以 及 掌握 多 
表 插 入 和 MERGE 命令 等 特性 的 用 法 。 

第 5 章 通过 一 些 实例 讲解 如 何 获取 数据 库 的 元 数据 信息 。 找 出 一 个 数据 库 的 索引 、 约 束 
和 表 往 往 非常 有 用 。 这 些 简单 的 例子 帮助 你 获取 关于 数据 库 模 式 的 信息 。 除 此 之 外 ， 这 
一 章 也 包括 一 些 动 态 SQL 示例 ， 例 如 用 SQL 生成 新 的 SQL. 

第 6 章 介绍 了 一 些 处 理 字符 串 的 实例 。SQL 的 字符 串 解析 能 力 并 不 出 众 ， 但 基于 数据 
库 的 大 量 专 有 函数 ， 再 加 上 一 点 点 创意 (通常 要 用 到 笛 卡 儿 积 )， 你 就 能 完成 不 少 工作 。 
其 中 一 些 更 加 有 趣 的 例子 包括 计算 一 个 字符 在 某 个 字符 串 里 出 现 过 多 少 次 ， 基 于 表 的 若 
干 行 生成 列表 ， 把 列表 和 字符 串 转 换 成 行 数据 ， 以 及 从 一 个 字母 和 数字 混合 的 字符 串 里 
提取 数值 和 字符 。 

第 7 章 给 出 了 一 些 常见 的 数字 运算 实例 。 这 些 例子 极 具 通用 性 ， 并 且 能 让 你 体会 到 窗口 
国 数 在 解决 涉及 动态 计算 和 聚合 的 问题 时 有 多 方便 。 这 一 章 的 示例 包括 计算 累加 值 ， 计 
算 平 均 数 、 中 位 数 和 众 数 ， 计 算 百 分 比 ， 在 聚合 运算 中 排除 Null 值 。 
第 8 章 是 涉及 日 期 处 理 的 两 章 中 的 第 1 章 。 对 于 日 常任 务 来 说 ， 处 理 简单 的 日 期 运算 十 
分 重要 。 这 一 章 给 出 的 示例 包括 计算 两 个 日 期 之 间 有 多 少 个 工作 日 ， 以 不 同 的 时 间 单 位 
(天 、 月 、 年 等 ) 算出 两 个 日 期 的 差 值 ， 以 及 统计 一 年 中 有 多 少 个 星期 一 。 
第 9 章 是 涉及 日 期 处 理 的 第 2 章 。 你 会 发 现 日 常 工作 中 最 为 常见 的 日 期 操作 实例 ， 包 括 
返回 一 年 包含 的 所 有 和 天， 计算 闵 年 ， 算 出 一 个 月 的 第 一 天 和 最 后 一 天 ， 生 成 日 历 ， 以 及 
填补 一 个 日 期 范围 里 缺失 的 日 期 。 

第 10 章 通过 一 些 实例 演示 如 何 识别 指定 范围 内 的 值 ， 以 及 如 何 创 建 一 系列 的 值 。 示 例 
包括 自动 生成 一 系列 行 数据 ， 填 补 一 个 数值 范围 里 缺失 的 值 ， 查 找 一 个 范围 的 开始 值 和 
结束 值 ， 以 及 查找 连续 的 值 。 
第 11 章 中 的 例子 有 时 被 开发 人 员 忽 视 ， 但 对 于 日 常 开发 工作 来 说 至 关 重 要 。 这 些 例子 
绝 不 比 其 他 例子 更 难 ， 但 我 却 见 到 许多 开发 人 员 用 非常 低 效 的 做 法 来 解决 同样 的 问题 。 
这 一 章 的 示例 包括 查找 “骑士 值 ”， 为 结果 集 分 页 ， 跳 过 表 里 的 某 些 行 ， 逆 序 查找 ， 检 
索 靠 前 的 n 行 ， 以 及 为 查询 结果 排序 。 

第 12 章 提供 了 一 些 数据 仓储 和 复杂 报表 生成 领域 常见 的 查询 。 我 最 初 的 愿望 就 是 把 这 
一 章 的 内 容 作为 本 书 的 主体 部 分 。 这 一 章 的 示例 包括 行列 互 换 (交叉 报表 )， 创 建 数据 
分 组 ， 创 建 直方 图 ， 计 算出 简单 而 完整 的 小 计 值 ， 在 一 个 动态 的 行 数据 窗口 之 上 执行 聚 
合计 算 ， 以 及 基于 给 定 的 时 间 单 位 做 行 数据 分 组 。 
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。 第 13 章 介 绍 了 一 些 与 层次 化 有 关 的 实例 


。 无 论 采 用 何 种 建 模 方式 ， 你 总 会 在 某 个 时 刻 


需要 做 数据 格式 化 工作 ， 比 如 以 树 形 结构 或 者 父子 关系 形式 展现 出 来 。 这 一 章 提 供 的 例 
子 能 够 帮 你 完成 这 些 任 务 。 利 用 传统 的 SQL 创建 树 形 结构 的 数据 集 并 不 容易 ， 所 以 数 
据 库 厂商 提供 的 专 有 函数 在 这 一 章 里 显得 尤 共有 用 。 示 例 包 括 呈 现 数据 的 父子 关系 ， 从 
根 节 点 到 叶子 节点 逐 层 遍历 ， 以 及 构造 一 个 层次 结构 。 




















。 第 14 章 是 各 种 实例 的 大 杂烩 ， 它 们 很 难 



































被 昭和 人 某 个 问题 领域 ， 却 既 有 趣 又 有 用 。 这 一 














章 不 同 于 其 他 各 章 之 处 在 于 ， 它 只 聚焦 于 数据 库 厂商 提供 的 专 有 特性 。 每 个 实例 只 针对 
一 种 数据 库 而 设 ， 这 是 全 书 唯一 这 么 做 的 一 章 。 有 两 个 原因 促使 我 这 么 做 : 第 一 ， 我 想 
让 这 一 章 的 内 容 既 有 趣 又 带 些许 极 客 风格 ， 第 二 ， 有 些 实例 的 存在 就 是 为 了 突出 某 个 
数据 库 厂 商 的 专 有 函数 ， 因 为 在 其 他 关系 数据 库 管理 系统 里 没有 等 价 实现 (示例 包括 
SQL Server 的 PIVOT/UNPIVOT 操作 符 和 Oracle 的 MODEL 子 句 )。 在 某 些 情况 下 ， 你 能 简 
单 地 改造 一 下 这 一 章 提供 的 解决 方案 ， 将 其 用 于 另 一 种 数据 库 。 

° 附录 A 带 你 复习 窗口 函数 的 相关 知识 ， 并 且 详 细 讨 论 了 SQL 分 组 查询 。 你 可 能 不 熟悉 
窗口 函数 ， 附 录 A 可 以 帮助 你 快速 入 门 。 此 外 ， 根 据 我 的 经 验 ，GROUP BY 查询 的 使 用 
一 直 令 许多 开发 人 员 感 到 迷惑 。 附 录 A 精确 定义 了 何 为 SQL 分 组 查询 ， 并 且 给 出 了 多 
种 查询 示例 ， 以 进一步 解释 该 定义 。 接 着 ， 附 录 A 讨论 了 Null 值 对 分 组 、 聚 合 以 及 分 
区 的 影响 ， 最 后 讨论 了 窗口 函数 中 更 难 理解 却 功能 强大 的 OVER TA (FATA). 

。 附录 B 主要 是 向 David Rozenshtein 致敬 ， 并 把 我 在 SQL 开发 方面 的 成 就 归功 于 他 。 
Rozenshtein 的 作品 The Essence of SOL 是 我 在 课堂 之 外 买 的 第 一 本 SQL 书 。 我 当时 买 


























这 本 书 ， 并 非 为 了 应 付 考试 。 正 是 这 本 






















































































BAA FAR SQL 思考 。 时 至 今日 ， 我 仍 


把 自己 关于 SQL 工作 原理 的 许多 心得 体会 归功 于 这 本 书 。 与 我 读 过 的 其 他 SQL 书 相 比 ， 
它 是 如 此 与 众 不 同 ， 我 为 它 能 成 为 我 的 第 一 本 SQL 书 而 充满 感激 之 情 。 我 在 附录 B 中 
重新 审视 了 The Essence of SOL 里 出 现 过 的 一 些 查 询 语句 ， 并 给 出 了 使 用 窗口 函数 实现 
的 新 解决 方案 。( 在 The Essence of SOL 出 版 时 ， 窗 口 国 数 尚未 出 现 。) 











平台 和 版 本 


SQL 产品 日 新 月 异 。 各 个 厂商 不 断 地 为 各 自 

















的 产品 加 入 新 特性 和 新 功能 。 因 此 ， 我 要 先 告 





诉 你 本 书 是 为 各 个 数据 库 产 品 的 哪些 版 本 而 准备 的 。 


° DB2 v.8 

e Oracle Database 10g (除了 少数 实例 ， 本 
° PostgreSQL 8 

* SQL Server 2005 

° MySQL 5 


本 书 中 用 到 的 表 


本 书 中 的 大 部 分 例子 都 会 涉及 两 个 表 : EMP 
单 ， 仅 用 到 了 数字 、 字 符 串 和 日 期 字段 。DE 





的 解决 方案 也 都 适用 于 Oracle8i 和 Oracle9i) 





ZH DEPT R, EMP 表 有 14 行 数据 ， 它 非常 简 
PT 表 有 4 行 数据 ， 它 也 很 简单 ， 只 含有 数字 和 


字符 串 字 段 。 这 两 个 表 在 许多 现存 的 数据 库 教科 书 里 都 曾 出 现 过 ， 大 家 也 早已 熟知 在 员工 











和 部 门 之 间 所 存在 的 多 对 一 关系 。 


当 我 谈 到 示例 表 的 话题 时 ， 我 想 说 本 书 中 的 示例 除了 极 少 数 的 几 个 ， 几 乎 所 有 的 示例 都 会 
用 到 这 两 个 表 。 我 不 会 像 其 他 一 些 书 那样 ， 通 过 修改 示例 数据 来 构造 一 些 你 绝对 不 可 能 在 
真实 世界 里 实现 的 解决 方案 。 
说 到 解决 方案 ， 请 允许 我 稍微 提 一 下 ， 只 要 状况 允许 ， 我 都 会 尽 可 能 地 为 本 书 涉及 的 5 种 
关系 数据 库 管 理 系统 提供 通用 的 解决 方案 。 但 经 常 无 法 做 到 这 一 点 。 尽 管 如 此 ， 在 许多 情 
况 下 ， 多 种 数据 库 可 能 共用 一 种 解决 方案 。 举 例 而 言 ， 因 为 相互 支持 对 方 的 窗口 函数 ， 所 
以 Oracle 和 DB2 经 常 共用 解决 方案 。 如 果 解 决 方案 共用 或 非常 类 似 ， 那 么 在 讨论 部 分 也 





会 一 并 提 及 。 











EMP 表 和 DEPT 表 的 数据 分 别 如 下 所 示 。 


select * from emp; 


EMPNO ENAME 


HIREDATE 





SAL COMM DEPTNO 


7369 SMITH 
7499 ALLEN 
7521 WARD 

7566 JONES 
7654 MARTIN 
7698 BLAKE 
7782 CLARK 
7788 SCOTT 
7839 KING 

7844 TURNER 
7876 ADAMS 
7900 JAMES 
7902 FORD 

7934 MILLER 


CLERK 
SALESMAN 
SALESMAN 
MANAGER 
SALESMAN 
MANAGER 
MANAGER 
ANALYST 
PRESIDENT 
SALESMAN 
CLERK 
CLERK 
ANALYST 
CLERK 


select * from dept; 


DEPTNO DNAME 


7839 
7566 


7698 
7788 
7698 
7566 
7782 


17-DEC-1980 
20-FEB-1981 
22-FEB-1981 
02-APR-1981 
28-SEP-1981 
01-MAY-1981 
09- JUN- 1981 
09-DEC-1982 
17-NOV-1981 
08-SEP-1981 
12-JAN- 1983 
03-DEC-1981 
03-DEC-1981 
23- JAN- 1982 


10 ACCOUNTING 
20 RESEARCH 


30 SALES 


40 OPERATIONS 


除 此 之 外 ， 本 书 还 会 用 到 4 张 数据 透视 表 : T1, T10, T100 fü T500。 因 为 这 些 只 是 数据 透 
视 表 ， 所 以 我 认为 不 需要 给 它们 取 更 容易 懂 的 名 字 。 关 于 表 名 ， 跟 在 字母 7 后面 的 数字 表 





NEW YORK 


DALLAS 


CHICAGO 


BOSTON 





select id from t1; 





800 20 
1600 300 30 
1250 500 30 
2975 20 
1250 1400 30 
2850 30 
2450 10 
3000 20 
5000 10 
1500 0 30 
1100 20 
950 30 
3000 20 
1300 10 





F 始 。 例 如 ，T1 表 和 T10 表 的 数据 如 下 所 示 。 





select id from t10; 


@ O OO +I ON a > Ü N P. 


P= 


顺便 说 一 下 ， 一 些 数据 库 支 持 局 部 SELECT 语句 。 举 例 来 说 ， 可 以 只 有 SELECT 而 没有 FROM 
子 句 。 我 不 喜欢 这 样 的 用 法 ， 因 此 我 构造 了 T1 这 样 只 有 一 行 数据 的 表 并 针对 该 表 执 行 查 





询 ， 而 没有 使 用 局 部 查询 。 





任何 其 他 仅 用 于 特定 实例 和 章节 的 表 ， 我 会 在 书 中 的 适当 位 置 做 出 解释 。 


本 书 使 用 的 约定 





本 书 遵 循 了 许多 排版 和 代码 编写 约定 。 请 花 点 时 间 熟 悉 它 们 ， 这 有 助 于 加 深 你 对 本 书 内 容 











的 理解 。 代 码 编写 约定 尤其 重要 ， 
把 一 些 重要 的 约定 都 列 在 下 面 。 
排版 约定 

本 书 遵循 下 列 排版 约定 。 

大 写字 母 表示 SQL 关键 字 。 








因为 我 不 能 在 每 一 个 实例 中 都 重复 强调 一 遍 。 








办 此， 我 


小 写字 母 用 于 所 有 代码 示例 。 诸 如 C 和 Java 这 样 的 编程 语言 都 使 用 小 写 形式 的 关键 字 ， 
我 发 现 其 可 读 性 比 大 写 形式 更 好 。 因 此 ， 本 书 中 所 有 查询 语句 都 使 用 小 写 形式 。 


等 宽 粗 体 用 于 在 交互 示例 里 表示 用 户 输入 的 内 容 。 
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标 表示 小 技巧 、 





建议 或 者 一 般 性 提示 。 

















代码 编写 约定 


C 这 个 图 标 表 示警 告 或 注意 事项 。 


我 习惯 在 SQL 语句 中 全 部 用 小 写字 母 ， 不 管 是 关键 字 还 是 用 户 指 定 的 标识 符 。 例 如 : 





AJ 


= | xix 


select empno, ename 
from emp; 


你 的 习惯 可 能 不 同 。 例 如 ， 许 多 人 喜欢 把 SQL 关键 字 大 写 。 你 需要 遵循 你 喜欢 的 或 者 项 目 
要 求 的 风格 。 


尽管 代码 示例 用 小 写 形式 ， 但 在 正文 里 SQL 关键 字 和 标识 符 始终 都 是 大 写字 母 。 我 这 样 做 
是 为 了 将 它们 和 其 他 普通 文本 明确 区 分 开 来 。 例 如 ， 前 述 查 询 语句 展示 了 一 个 针对 EM xx 
的 SELECT 操作 。 

尽管 本 书 涵盖 了 5 个 数据 库 厂商 的 产品 ， 但 是 我 还 是 决定 用 同样 的 格式 呈现 所 有 产品 的 输 
出 结果 。 


EMPNO ENAME 


7369 SMITH 
7499 ALLEN 
































许多 实例 在 FROM 子 句 里 用 到 了 内 骨 视 图 或 子 查 询 。ANSI SQL 标准 规定 要 给 它们 取 别 名 。 
(只 有 Oracle 不 要 求 指定 这 一 类 别名 。) 因此 ， 我 在 解决 方案 里 经 常用 类 似 x 和 y 这 样 的 别 
名 来 标识 内 髓 视图 。 
select job, sal 
from (select job, max(sal) sal 
from emp 
group by job) x; 
注意 最 后 紧 挨 着 圆 括号 的 字母 X。 在 这 里 ， 字 母 X 变 成 了 FROM 子 句 里 那个 子 查询 返回 的 
表 的 名 字 。 列 别名 是 一 个 有 用 的 工具 ， 能 帮 我 们 写 出 自 注释 的 代码 ， 相 对 而 言 ，( 本 书 中 
出 现 过 的 多 数 ) 内 山 视 图 的 别名 只 是 一 种 形式 化 的 东西 。 通 常 我 会 为 它们 取 一 个 简单 的 名 
字 ， 诸 如 X、Y、Zz、TMP1 和 TMP2。 在 某 些 情况 下 ， 如 果 我 觉得 取 一 个 更 好 的 别名 有 助 于 增 
加 可 读 性 ， 我 就 会 那样 做 。 


你 将 会 看 到 在 每 个 实例 的 解决 方案 部 分 出 现 的 SQL 语句 ， 甚 每 一 行 都 会 被 编号 ， 例 如 


1 select ename 
2 from emp 
3 where deptno = 10 


这 些 数 字 并 不 是 语法 的 一 部 分 ， 我 把 它们 包含 进来 只 是 为 了 方便 在 每 个 实例 的 讨论 部 分 能 
使 用 序号 来 引用 查询 语句 里 的 各 个 部 分 。 


使 用 示例 代码 


本 书 的 目的 在 于 帮助 你 完成 工作 。 一 般 来 说 ， 你 可 以 在 你 的 程序 和 文档 中 使 用 本 书 的 代 
码 。 只 要 不 是 大 规模 地 复制 代码 ， 你 就 不 需要 联系 我 们 取得 授权 。 举 例 而 言 ， 你 写 的 一 个 
程序 用 到 了 本 书 的 几 个 代码 片段 ， 这 是 不 需要 授权 的 。 但 是 ， 如 果 你 把 书 中 的 示例 代码 刻 
录 到 CD-ROM， 并 拿 去 出 售 和 分 发 ， 则 需要 获得 授权 。 在 回答 问题 时 引用 本 书 以 及 本 书 的 
示例 代码 无 须 取得 授权 。 但 如 果 要 在 你 的 产品 文档 里 收录 本 书 中 出 现 过 的 大 量 示例 代码 ， 
















































































| Au. s 


XX BJ 


Till 


则 需要 获得 授权 。 

欢迎 你 在 使 用 本 书 的 示例 代码 时 注 明 出 处 ,但 这 不 是 强制 要 求 。 通 常 要 注 明 书 名 、 作 者 、 
出 版 社 和 ISBN。 例 如 : SQL Cookbook, by Anthony Molinaro. Copyright 2006 O’Reilly Media, 
Inc., 0-596-00976-3。 

如 果 你 认为 你 对 示例 代码 的 使 用 不 在 合理 使 用 和 上 述 无 须 授权 的 范围 之 内 ， 那 么 请 通过 
permissions@oreilly.com 联系 我 们 。 


联系 我 们 
请 把 对 本 书 的 评价 和 问题 发 给 出 版 社 。 
美国 : 

O'Reilly Media, Inc. 


1005 Gravenstein Highway North 
Sebastopol, CA 95472 


中 国 : 

北京 市 西城 区 西直门 南大 街 2 号 成 铭 大 厦 C 座 807 室 (100035) 

奥 莱 利 技术 咨询 (北京 ) 有 限 公司 
O'Reilly 的 每 一 本 书 都 有 专属 网 页 ， 你 可 以 在 那儿 找到 本 书 的 相关 信息 ， 包 括 勘 误 表 、 示 例 
代码 以 及 其 他 信息 。 本 书 的 网 站 地 址 是 : http://shop.oreilly.com/product/9780596009762.do。 


对 于 本 书 的 评论 和 技术 性 问题 ， 请 发 送 电子 邮件 到 : bookquestions@oreilly.com。 
要 了 解 更 多 O' Reilly 图 书 、 培 训 课程 、 会 议和 新 闻 的 信息 ， 请 访问 网 站 : 
http://www.oreilly.com, 


我 们 在 Facebook 的 地 址 是 http://facebook.com/oreilly。 
请 关注 我 们 的 Twitter 动态 : http://twitter.com/oreillymedia。 







































































我 们 的 YouTube 视频 地 址 是 http://www.youtube.com/oreillymedia。 


Safari° Books Online 


„© Safari Books Online (http://www.safaribooksonline.com) 是 应 运 而 

4 Safa [| 生 的 数字 图 书馆 。 它 同时 以 图 书 和 视频 的 形式 出 版 世界 顶级 技术 

和 商务 作家 的 专业 作品 。 技 术 专 家 、 软 件 开发 人 员 、Web 设计 师 、 

商务 人 士 和 创意 专家 等 ， 在 开展 调研 、 解 决 问题 、 学 习 和 认证 培训 时 ， 都 将 Safari Books 
Online 视 作 获取 资料 的 首选 渠道 。 

对 于 组 织 团体 、 政 府 机 构 和 个 人 ，Safari Books Online 提供 各 种 产品 组 合 和 灵活 的 定 

价 策略 。 用 户 可 通过 一 个 功能 完备 的 数据 库 检 索 系 统 访问 O'Reilly Media, Prentice 

Hall Professional, Addison-Wesley Professional, Microsoft Press, Sams, Que, Peachpit 

Press, Focal Press, Cisco Press, John Wiley & Sons, Syngress, Morgan Kaufmann, IBM 









































Redbooks. Packt, Adobe Press, FT Press, Apress. Manning. New Riders, McGraw-Hill, 
Jones & Bartlett, Course Technology 以 及 其 他 几 十 家 出 版 社 的 上 千 种 图 书 、 培 训 视 频 和 正 
式 出 版 之 前 的 书稿 。 要 了 解 Safari Books Online 的 更 多 信息 ， 我 们 网 上 见 。 
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技巧 。 我 想 感谢 Aaron Boyd 给 予 我 的 支持 和 善意 帮助 ， 最 重要 的 还 有 他 的 那些 好 建议 。 
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贡献 了 那个 解决 方案 给 我 ， 我 甚至 无 须 再 找 个 DB2 系统 来 做 测试 ! 我 向 他 解释 了 WITH F 
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Anthony Molinaro 
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本 章 主要 介绍 基本 的 SELECT 语句 。 充 分 理解 这 些 基础 知识 十 分 重要 ， 因 











为 本 章 中 的 许多 内 


容 不 仅 会 出 现在 后 面 更 复杂 的 实例 里 ， 同 时 也 是 日 常 SQL 操作 的 一 部 分 。 








1.1 检索 所 有 行 和 列 








1. 问题 
你 有 一 张 表 ， 并 且 想 查看 表 中 的 所 有 数据 。 
2. 解决 方案 
用 特殊 符号 “*” 对 该 表 执 行 SELECT 查询 。 
1 select * 
2 from emp 
3. 讨论 











在 SQL 中 ， 符 号 “*” 有 着 特殊 含义 。 该 符号 使 得 查询 语句 返回 指定 表 的 所 有 列 。 由 于 设 


有 指定 WHERE 子 句 ， 因 此 所 有 行 都 会 被 提取 出 来 。 你 也 可 以 使 用 另 一 种 方法 ， 列 出 表 中 的 


每 一 列 。 


select empno,ename,job,sal,mgr,hiredate,comm,deptno 
from emp 














在 交互 式 即席 查询 中 ， 使 用 SELECT * 会 更 加 容易 。 然 而 ， 在 编写 程序 代码 时 ， 最 好 具体 指 


明 每 一 列 。 虽 然 执行 结果 相同 ， 但 指明 每 一 列 让 你 能 清楚 地 知道 查询 语句 会 返回 哪些 列 。 





























类 似 地 ， 对 于 其 他 人 而 言 ， 这 样 的 查询 语句 也 会 更 易于 理解 ， 因 为 他 们 可 能 不 知道 所 要 查 




















询 的 表 里 包 含 哪些 列 。 


1.2 ”筛选 行 

1. 问题 

你 有 一 张 表 ， 并 且 只 想 查 看 满足 指定 条 件 的 行 。 

2. 解决 方案 

使 用 WHERE 子 句 指明 保留 哪些 行 。 例 如 ， 下 面 的 语句 将 查找 部 门 编号 为 10 的 所 有 员工 。 


1 select * 
2 from emp 
3 where deptno = 10 























3. 讨论 

可 以 使 用 WHERE FAR fiie HH def SP ERIT) TT. AR WHERE 子 句 的 表达 式 针 对 某 一 行 的 判 
定 结果 为 真 ， 那 么 就 会 返回 该 行 的 数据 。 

大 多 数 数据 库 都 支持 常用 的 运算 符 ， 例 如 =、<、>、<=、>=、! 和 <>。 除 此 之 外 ， 你 可 能 
需要 指定 多 个 条 件 来 秘 选 数据 ， 这 时 就 需要 使 用 AND, oR 和 圆 括 号 。 下 一 个 实例 将 讨论 这 
一 点 。 


13 ”查找 满足 多 个 查询 条 件 的 行 
1. 问题 

你 想 返 回 满足 多 个 查询 条 件 的 行 。 

2. 解决 方案 


使 用 带 有 OR 和 AND 条 件 的 WHERE 子 句 。 例 如 ， 如 果 你 想 找 出 部 门 编号 为 10 的 所 有 员工 、 
有 业务 提成 的 所 有 员工 以 及 部 门 编号 是 20 且 工 资 低 于 2000 美元 的 所 有 员工 。 





























1 select * 

2 from emp 

3 where deptno - 10 

4 or comm is not null 

5 or sal «- 2000 and deptno-20 


3. 讨论 

你 可 以 组 合 使 用 AND. OR FEL 15 ZÉ Dü oe i E Ae ETRAS ERUIT. EAA, WHERE 
子 句 找 出 了 如 下 的 数据 。 

e DEPTNO 等 于 10， 或 

° COMM 不 是 Null, 或 

° DEPTNO 等 于 20 且 工 资 不 高 于 2000 美元 的 员工 。 

圆 括号 里 的 查询 条 件 被 一 起 评估 。 例 如 ， 试 想 一 下 如 果 采 用 下 面 的 做 法 ， 检 索 结果 会 发 生 
什么 样 的 变化 。 


select * 
from emp 
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where ( deptno = 10 
or comm is not null 
or sal <= 2000 




















) 
and deptno=20 
EMPNO ENAME JOB MGR HIREDATE SAL COMM DEPTNO 
7369 SMITH CLERK 7902 17-DEC-1980 800 20 
7876 ADAMS CLERK 7788 12-JAN-1983 1100 20 
A 
1.4 ”筛选 列 
1. 问题 
你 有 一 张 表 ， 并 且 只 想 查 看 特定 列 的 值 。 
2. 解决 方案 


指定 你 感 兴趣 的 列 。 例 如 ， 只 查看 员工 的 名 字 、 部 门 编号 和 工资 。 


1 select ename,deptno,sal 
2 from emp 


3. 讨 论 
在 SELECT 语句 里 指定 具体 的 列 名 ， 可 以 确保 查询 语 名 不 会 返回 无 关 的 数据 。 当 在 整个 网 络 
范围 内 检索 数据 时 ， 这 样 做 尤为 重要 ， 因 为 它 避 免 了 把 时 间 浪 费 在 检索 不 需要 的 数据 上 。 


1.5 创建 有 意义 的 列 名 


1. 问题 
你 可 能 想 要 修改 检索 结果 的 列 名 ， 使 其 更 具 可 读 性 且 更 易于 理解 。 考 虑 下 面 这 个 查询 ， 它 
返回 的 是 每 个 员工 的 工资 和 业务 提成 。 


1 select sal,comm 
2 from emp 


sal 指 的 是 什么 ? 是 sale 的 缩写 吗 ? 是 人 名 吗 ? comm 又 是 什么 ? 是 communication 的 缩写 
吗 ? 显然 ， 检 索 结 果 应 该 让 人 容易 理解 。 

2. 解决 方案 

使 用 As 关键 字 ， 并 以 original name AS new nane 的 形式 来 修改 检索 结果 的 列 名 。 对 于 一 些 
数据 库 而 言 ，AS 不 是 必需 的 ， 但 所 有 的 数据 库 都 支持 这 个 关键 字 。 


1 select sal as salary, comm as commission 
2 from emp 



















































































SALARY COMMISSION 


800 
1600 300 
1250 500 
2975 
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1250 1300 
2850 
2450 
3000 
5000 
1500 0 
1100 
950 
3000 
1300 


3. 讨论 
使 用 AS 关键 字 重 新 命名 查询 所 返回 的 列 ， 即 是 创建 别名 。 新 的 列 名 被 称 作 别 名 。 创 建 好 
的 别名 对 于 查询 语句 大 有 神 益 ， 它 能 让 查询 结果 更 易于 理解 。 


1.6 ”在 WHERE 子 名 中 引用 别名 列 


1. 问题 
你 已 经 为 检索 结果 集 创建 了 有 意义 的 列 名 ， 并 且 想 利用 WHERE 子 句 过 滤 掉 部 分 行 数据 。 但 
是 ， 如 果 你 尝试 在 WHERE 子 句 中 引用 别名 列 ， 查 询 无 法 顺利 执行 。 

select sal as salary, comm as commission 


from emp 
where salary < 5000 


2. 解决 方案 

把 查询 包装 为 一 个 内 骨 视 图 ， 这 样 就 可 以 引用 别名 列 了 。 
1 select * 
2 fronm ( 


3 select sal as salary, comm as commission 
4 from emp 





















































5 ) x 
6 where salary < 5000 
3. 讨论 





fF Ar al IJ Sc rp, nA AS fE HUB E. E WHERE 子 句 里 直接 引用 com 列 和 SAL 
列 ， 也 可 以 达到 同样 的 效果 。 当 你 想 在 WHERE 子 句 中 引用 下 列 内 容 时 ， 这 个 解决 方案 告诉 
你 该 如 何 做 。 
。 聚合 函数 
。 标量 子 查 询 
。 窗口 函数 
。 别名 
将 含有 别名 列 的 查询 放 入 内 内 视 图 ， 就 可 以 在 外 层 查 询 中 引用 别名 列 。 为 什么 要 这 么 做 
WE? WHERE 子 名 会 比 SELECT 子 句 先 执行 ， 就 最 初 那个 失败 的 查询 例子 而 言 ， 当 WHERE 子 名 
被 执行 时 ，SALARY 和 COMMISSION 尚 不 存在 。 直 到 WHERE 子 句 执行 完毕 ， 那 些 别 名 列 才 会 生 
效 。 然 而 ，FROM 子 名 会 先 于 WHERE 子 句 执行 。 如 果 把 最 初 的 那个 查询 放 入 一 个 FROM FA, 
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其 查询 结果 会 在 最 外 层 的 WHERE 子 句 开始 之 前 产生 ， 这 样 一 来 ， 最 外 层 的 WHERE 子 句 就 能 
“ 看见” 别名 列 了 。 当 表 里 的 某 些 列 没有 被 恰当 命名 的 时 候 ， 这 个 技巧 尤其 有 用 。 


ya 


a ERAP, ARIRIH X. JEHEBUE BUR PERS 2225 AERA , 
p^ 但 对 于 某 些 数据 库 而 言 ， 确 实 必 须 如 此 。 不 过 ， 所 有 的 数据 库 都 支持 这 一 


RJ 
"uM 占 
* Jno 


1.7 ”串联 多 列 的 值 


1. 问题 
你 想 将 多 列 的 值 合并 为 一 列 。 例 如 ， 你 想 查 询 EMP 表 ， 并 获得 如 下 结果 集 。 
CLARK WORKS AS A MANAGER 


KING WORKS AS A PRESIDENT 
MILLER WORKS AS A CLERK 


然而 ， 你 需要 的 数据 来 自 EMP 表 的 ENAME 列 和 JOB 列 。 


select ename, job 
from emp 
where deptno = 10 


























ENAME JOB 
CLARK MANAGER 
KING PRESIDENT 
MILLER CLERK 

2. 解决 方案 


使 用 数据 库 中 的 内 置 函 数 来 串联 多 列 的 值 。 
DB2, Oracle 和 PostgreSQL 
这 些 数据 库 把 双 竖 线 作 为 串联 运算 符 。 

1 select ename||' WORKS AS A '||job as msg 


2 from emp 
3 where deptno=10 





MySQL 
该 数据 库 使 用 CONCAT 函数 。 
1 select concat(ename, ' WORKS AS A ',job) as msg 


2 from emp 
3 where deptno=10 


SQL Server 
该 数据 库 使 用 “+” 作 为 串联 运算 符 。 
1 select ename + ' WORKS AS A ' + job as msg 


2 from emp 
3 where deptno=10 
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3. 讨论 
使 用 CONCAT 国 数 可 以 串联 多 列 的 值 。 在 DB2、 Oracle 和 PostgreSQL 中 ” 
数 的 快捷 方式 ， 在 SQL Server 中 则 为 “+”。 


1.8 在 SELECT 语句 里 使 用 条 件 逻 辑 


1. 问题 

你 想 在 SELECT 语句 中 针对 查询 结果 值 执行 IF-ELSE 操作 。 例 如 ， 你 想 生 成 类 似 这 样 的 
结果 : 如 果 员 工 的 工资 少 于 2000 美元 ， 就 返回 UNDERPAID， 如 果 超 过 4000 美元 就 返回 
OVERPAID; 若 介 于 两 者 之 间 则 返回 OK。 查 询 结果 如 下 所 示 。 





|” A CONCAT Ë 


























ENAME SAL STATUS 
SMITH 800 UNDERPAID 
ALLEN 1600 UNDERPAID 
WARD 1250 UNDERPAID 
JONES 2975 OK 
MARTIN 1250 UNDERPAID 
BLAKE 2850 OK 
CLARK 2450 OK 
SCOTT 3000 OK 
KING 5000 OVERPAID 
TURNER 1500 UNDERPAID 
ADAMS 1100 UNDERPAID 
JAMES 950 UNDERPAID 
FORD 3000 OK 
MILLER 1300 UNDERPAID 
2. 解决 方案 
在 SELECT 语句 里 直接 使 用 CASE 表达 式 来 执行 条 件 逻 辑 。 
1 select ename,sal, 
2 case when sal <= 2000 then 'UNDERPAID' 
3 when sal >= 4000 then 'OVERPAID' 
4 else 'OK' 
5 end as status 
6 from emp 


3. 讨论 

CASE 表达 式 能 对 查询 结果 执行 条 件 逻 辑 判 断 。 你 可 以 为 CASE 表达 式 的 执行 结果 取 一 个 别 
名 ， 使 结果 集 更 有 可 读 性 。 就 本 例 而 言 ，STATUS 就 是 CASE 表达 式 执行 结果 的 别名 。ELSE 
子 句 是 可 选 的 ， 若 没有 它 ， 对 于 不 满足 测试 条 件 的 行 ，CASE 表达 式 会 返回 Null, 


ma PE 
1.9 ”限定 返回 行 数 
1. 问题 
你 想 限 定 查 询 结 果 的 行 数 。 你 不 关心 排序 ， 任 意 行 都 可 以 。 









































2. 解决 方案 

使 用 数据 库 的 内 置 功能 来 控制 返回 的 行 数 。 
DB2 

使 用 FETCH FIRST 子 句 。 


1 select * 
2 from emp fetch first 5 rows only 





MySQL 和 PostgreSQL 
使 用 LIMIT 子 句 。 


1 select * 
2 from emp limit 5 

















Oracle 
对 于 Oracle 而 言 ， 通 过 在 WHERE 子 句 中 限制 ROWNUM 的 值 来 获得 指定 行 数 的 结果 集 。 
1 select * 


2 from emp 
3 where rownum <= 5 


SQL Server 

使 用 Top 关键 字 限 定 返 回 行 数 。 
1 select top 5 * 
2 from emp 


3. 讨论 

许多 数据 库 提供 了 类 似 FETCH FIRST FO LIMIT 这 样 的 子 名 来 指定 查询 结果 的 行 数 。Oracle 5 

此 不 同 ， 你 必须 使 用 ROWNUM 的 函数 ， 该 函数 会 为 结果 集 里 的 每 一 行 指定 一 个 行 号 (从 1 开 

18, BWK). 

当 你 使 用 ROWNUM<=5 限定 只 返回 最 初 的 5 行 数据 时 ， 会 发 生 如 下 的 事情 。 

(1) Oracle 执行 查询 。 

(2) Oracle 取得 第 一 行 数据 ， 并 把 它 的 行 号 定 为 1。 

(3) 已 经 超过 第 5 行 了 吗 ? 如 果 没 有 ，Oracle 会 返回 当前 行 ， 因 为 当前 的 行 号 满足 小 于 或 等 
于 5 这 一 条 件 。 如 果 已 经 超过 ， 那 么 Oracle 就 不 返回 当前 行 。 

(4)Oracle 取得 下 一 行 数据 ， 并 且 将 行 号 加 1 (得 到 2， 然后 得 到 3， 再 然后 得 到 A, DUE 
类 推 )。 

(5) 返 回 第 3 步 。 

如 上 述 处 理 过程 所 示 ，Oracle 会 在 取得 某 一 行 数据 之 后 再 为 其 编号 ， 这 是 关键 之 处 。 很 多 

Oracle 开发 人 员 试 图 只 获取 一 行 数据 ， 比 如 指定 ROWNUM=5， 和 希望 只 返回 第 5 行 。 但 是 ， 同 

时 使 用 ROWNUM 和 等 式 条 件 是 不 对 的 。 以 下 是 使 用 ROWNUM=5 后 实际 发 生 的 事情 。 

(1) Oracle 执行 查询 。 

(2) Oracle 取得 第 一 行 数据 ， 并 把 它 的 行 号 定 为 1。 
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(3) 已 经 到 第 5$ 行 了 吗 ? 如 果 没 有 ， 那 么 Oracle 会 舍弃 这 一 行 ， 因 为 它 不 符合 条 件 。 如 果 
是 ， 那 么 Oracle 会 返回 当前 行 。 但 是 ， 行 号 永远 不 可 能 到 5 | 

(4) Oracle 取得 下 一 行 数据 ， 并 把 它 的 行 号 定 为 1。 这 是 因为 查询 结果 的 第 1 行 的 行 号 必须 
是 1。 

(5) 返回 第 3 步 。 

深入 理解 这 一 过 程 ， 你 会 明白 为 什么 通过 指定 等 式 条 件 ROWNUM=5 来 获取 第 5 行 会 失败 。 如 

果 你 不 先 获取 第 1 行 到 第 4 行 ， 第 5 行 从 何 而 来 ? 

你 可 能 会 注意 到 ，ROWNUM=1 确实 能 得 到 第 1 行 ， 这 似乎 与 上 述 解释 相 矛 盾 。ROWNUM=1 运 

行 正常 的 原因 在 于 ，Oracle 必须 至 少 尝试 一 次 读 取 ， 才 能 确定 表 里 是 否 有 i 记录。 仔细 阅 

读 以 上 处 理 过 程 ， 用 1 RPR 5， 你 就 会 理解 为 什么 指定 ROWNUM=1 作为 条 件 (为 了 返回 一 

行 ) 会 成 功 。 


`. ` ++ £— ` 
1.10 ”随机 返回 若干 行 记 录 
1. 问题 
你 希望 从 表 中 获取 特定 数量 的 随机 记录 。 修 改 下 面 的 语句 ， 以 便 连 续 执 行 查 询 并 使 结果 集 
含有 5 行 不 同 的 数据 。 


select ename, job 
from emp 


2. 解决 方案 
使 用 数据 库 的 内 置 函 数 来 随机 生成 查询 结果 。 在 ORDER BY 子 句 里 使 用 该 内 置 函数 可 以 实现 
查询 结果 的 随机 排序 。 最 后 要 结合 1.9 节 中 的 技巧 从 随机 排序 结果 里 获取 限定 数目 的 行 。 
DB2 
把 内 置 函 数 RAND 和 ORDER BY, FETCH 结合 使 用 。 

1 select ename, job 


2 from emp 
3 order by rand() fetch first 5 rows only 

































































MySQL 
把 内 置 函 数 RAND FH LIMIT, ORDER BY 结合 使 用 。 


1 select ename job 
2 from emp 
3 order by rand() limit 5 


PostgreSQL 
把 内 置 函 数 RANDOM 和 LIMIT, ORDER BY 结合 使 用 。 
1 select ename ,job 


2 from emp 
3 order by random() limit 5 








Oracle 
在 内 置 包 DBMS_RANDOM 里 可 以 找到 VALUE 函数 ， 把 该 内 置 函数 和 ORDER BY. [N E ER C 
ROWNUM 结合 使 用 。 





1 select * 

2 from ( 

3 select ename, job 

4 from emp 

6 order by dbms random.value() 
7 

8 


) 
where rownum <= 5 
SQL Server 
同时 使 用 内 置 函 数 NEWID 和 TOP, ORDER BY 来 返回 一 个 随机 结果 集 。 
1 select top 5 ename ,job 


2 from emp 
3 order by newid() 


3. 讨论 

ORDER BY 子 句 能 够 接受 一 个 国 数 的 返回 值 ， 并 利用 该 值 改变 当前 结果 集 的 顺序 。 在 本 例 中 ， 
所 有 查询 都 是 在 ORDER BY 子 名 执行 结束 后 才 限 定 返 回 值 的 行 数 。 看 过 Oracle 的 解决 方案 
后 ， 非 Oracle 用 户 可 能 会 受到 启发 ， 因 为 Oracle 的 解决 方案 展示 了 (在 理论 上 ) 其 他 数据 
库 内 部 是 如 何 实现 该 查询 的 。 

不 要 误 认 为 ORDER BY 子 句 中 的 函数 是 数值 常量 ， 这 一 点 很 重要 。 如 果 ORDER BY 子 句 使 用 数 
值 常量 ， 那 么 就 需要 按照 SELECT 列表 里 的 顺序 来 排序 。 如 果 ORDER BY 子 句 使 用 了 函数 ， 那 
么 就 需要 按照 该 函数 的 返回 值 来 排序 ， 而 函数 返回 的 值 是 根据 结果 集 里 的 每 一 行 计算 而 来 
的 。 


1.11 查找 Null 值 










































































1. 问题 

你 想 查找 特定 列 的 值 为 Null 的 所 有 行 。 

2. 解决 方案 

要 判断 一 个 值 是 否 为 NNLL， 必 须 使 用 IS Null, 
1 select * 


2 from emp 
3 where comm is null 


3. 讨论 

Null 值 不 会 等 于 或 者 不 等 于 任何 值 ， 甚 至 不 能 与 其 自身 作 比 较 。 因 此 ， 不 能 使 用 = 或 != 
来 测试 某 一 列 的 值 是 否 为 NNLL。 判 断 一 行 是 否 含 有 NuLL， 必 须 使 用 IS NuLL。 你 也 可 以 使 
JH 1s NOT Null 来 找到 给 定 列 的 值 不 是 Null 的 所 有 行 。 
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1.12. 把 NuLL 值 转换 为 实际 值 
































1. 问题 
有 一 些 行 包含 Null 值 ， 但 是 你 想 在 返回 结果 里 将 其 替换 为 非 Null 值 。 
2. 解决 方案 


使 用 COALESCE 函数 将 Null 值 替 代为 实际 值 。 


1 select coalesce(comm,0) 
2 from emp 


3. 讨论 
需要 为 COALESCE 国 数 指定 一 个 或 多 个 参数 。 该 国 数 会 返回 参数 列表 里 的 第 一 个 非 NuLL 值 。 
在 本 例 中 ， 若 COM 不 为 NtL， 会 返回 COMM 值 ， 否 则 返回 0。 

处 理 Null 值 时 ， 最 好 利用 数据 库 的 内 置 功能 。 在 许多 情况 下 ， 你 会 发 现 有 不 止 一 个 函数 能 
解决 本 实例 中 的 问题 。COALESCE 函数 只 是 恰好 适用 于 所 有 的 数据 库 。 除 此 之 外 ，CASE 也 适 
用 于 所 有 数据 库 。 


select case 
when comm is not null then comm 
else 0 
end 
from emp 


尽管 CASE 也 能 把 Null 值 转换 成 实际 值 ， 但 COALESCE 函数 更 方便 、 更 简洁 。 


1.13 ”查找 匹配 项 


1. 问题 
你 想 返 回 匹配 某 个 特定 字符 串 或 模式 的 行 。 考 虑 下 面 的 查询 及 其 结果 集 。 
select ename, job 


from emp 
where deptno in (10,20) 


TI 
























































ENAME JOB 

SMITH CLERK 
JONES MANAGER 
CLARK MANAGER 
SCOTT ANALYST 
KING PRESIDENT 
ADAMS CLERK 
FORD ANALYST 


MILLER CLERK 
你 想 从 编号 为 10 和 20 的 两 个 部 门 中 找到 名 字 中 含有 字母 I 或 职位 以 ER 结尾 的 人 。 








SMITH CLERK 
JONES MANAGER 
CLARK MANAGER 
KING PRESIDENT 
MILLER CLERK 

2. 解决 方案 

结 


合 使 用 LIKE 运算 符 和 SQL 通配符 %。 


1 select ename, job 

2 from emp 

3 where deptno in (10,20) 

4 and (ename like '%I%' or job like '%ER') 


3. 讨论 

被 用 于 LIKE 模式 匹配 操作 时 ， 运 算 符 % 可 以 匹配 任意 长 度 的 连续 字符 。 大 多 数 SQL 实现 
也 提供 了 下 划 线 (_) 运算 符 ， 用 于 匹配 单个 字符 。 通 过 在 字母 I 前 后 都 加 上 %， 任何 (在 
任意 位 置 ) 出 现 工 的 字符 串 都 会 被 检索 出 来 。 如 果 没 有 使 用 % 把 检索 模式 围 起 来 ， 那 么 % 
的 位 置 会 影响 查询 结果 。 例 如 ， 为 了 找到 以 ER 结尾 的 职位 ， 就 需要 在 ER 的 前 面 加 上 %; 
如 果 是 要 找 以 ER 开头 的 职位 ， 那 就 应 该 在 ER 的 后 面 加 上 %。 
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第 2 章 


查询 结 采 排序 





本 章 主要 介绍 如 何 使 查询 结果 个 性 化 。 如 果 知 道 如 何 控制 和 修改 结果 集 ， 你 就 能 提供 更 具 
可 读 性 、 更 有 意义 的 数据 。 


2.1 以 指定 顺序 返回 查询 结果 


1. 问题 
你 想 显示 部 门 编号 为 10 的 员工 的 名 字 、 职 位 和 工资 ， 并 根据 工资 从 低 到 高 排序 。 你 希望 
返回 如 下 结果 集 。 





ENAME JOB SAL 
MILLER CLERK 1300 
CLARK MANAGER 2450 
KING PRESIDENT 5000 
2. 解决 方案 
使 用 ORDER BY 子 句 。 
select ename job,sal 


1 
2 from emp 
3 where deptno - 10 
4 order by sal asc 
3. 讨论 
ORDER BY 子 句 可 以 对 结果 集 排序 。 本 实例 针对 SAL 按照 升序 排列 。 默 认 情况 下 ，ORDER BY 
会 做 升序 排列 ， 因 此 ASC 子 句 是 可 选项 。 相 应 地 ， 也 可 以 通过 指定 DESC 执行 降序 排列 。 





select ename,job,sal 
from emp 

where deptno = 10 
order by sal desc 


ENAME JOB SAL 
KING PRESIDENT 5000 
CLARK MANAGER 2450 
MILLER CLERK 1300 














你 也 可 以 不 指定 用 于 排序 的 列 名 ， 而 指定 一 个 数值 


匹配 SELECT 列表 里 的 列 ， 如 下 所 示 。 


select ename, job,sal 
from emp 

where deptno - 10 
order by 3 desc 


ENAME JOB SAL 
KING PRESIDENT 5000 
CLARK MANAGER 2450 
MILLER CLERK 1300 





EIR ORDER BY 子 句 里 的 数字 3 对 应 着 SELECT 列表 的 第 3 列 ， 即 SAL, 


22 ”多 字段 排序 


来 指 代 该 列 。 数 值 从 1 开始 ， 从 左 向 右 


针对 EMP 表 的 数据 ， 你 想 先 按照 DEPTNO 升序 排列 ， 然 后 再 按照 SAL 降序 排列 。 你 希望 返回 





1. 问题 

如 下 所 示 的 结果 集 。 
EMPNO DEPTNO SAL ENAME 
7839 10 5000 KING 
7782 10 2450 CLARK 
7934 10 1300 MILLER 
7788 20 3000 SCOTT 
7902 20 3000 FORD 
7566 20 2975 JONES 
7876 20 1100 ADAMS 
7369 20 800 SMITH 
7698 30 2850 BLAKE 
7499 30 1600 ALLEN 
7844 30 1500 TURNER 
7521 30 1250 WARD 
7654 30 1250 MARTIN 
7900 30 950 JAMES 

2. 解决 方案 





PRESIDENT 
MANAGER 
CLERK 
ANALYST 
ANALYST 
MANAGER 
CLERK 
CLERK 
MANAGER 
SALESMAN 
SALESMAN 
SALESMAN 
SALESMAN 
CLERK 


在 ORDER BY 子 句 中 列 出 不 同 的 排序 列 ， 以 逗号 分 隔 。 
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1 select empno,deptno,sal,ename, job 
2 from emp 
3 order by deptno, sal desc 


3. 讨论 
ORDER BY 的 执行 顺序 是 从 左 到 右 的 。 如 果 使 用 SELECT 列表 项 对 应 的 位 置 序号 来 指定 排序 
项 ， 那 么 这 个 数字 序号 不 能 大 于 SELECT 列表 里 的 项 目 个 数 。 一 般 而 言 ， 你 也 可 以 根据 一 个 


没有 被 包含 在 SELECT 列表 里 的 列 来 排序 ， 但 必须 明确 地 指定 列 名 。 不 过 ， 如 果 你 的 查询 语 
名 里 有 GROUP p BY 或 DISTINCT, 那么 就 不 能 按照 SELECT 列表 之 外 的 列 进 行 排序 。 


2.3 依据 子 串 排 序 


1. 问题 
你 想 按照 一 个 字符 串 的 特定 部 分 排列 查询 结果 。 例 如 ， 你 希望 从 EMP 表 检 索 员 工 的 名 字 和 
职位 ， 并 且 按 照 职位 字段 的 最 后 两 个 字符 对 检索 结果 进行 排序 。 结 果 集 应 该 像 下面 这 样 。 





























ENAME JOB 
KING PRESIDENT 
SMITH CLERK 
ADAMS CLERK 
JAMES CLERK 
MILLER CLERK 
JONES MANAGER 
CLARK MANAGER 
BLAKE MANAGER 
ALLEN SALESMAN 
MARTIN SALESMAN 
WARD SALESMAN 
TURNER SALESMAN 
SCOTT ANALYST 
FORD ANALYST 
2. 解决 方案 


DB2. MySQL. Oracle 和 PostgreSQL 
在 ORDER BY 子 句 里 使 用 SUBSTR 国 数 。 
select ename, job 


from emp 
order by substr(job,length(job)-2) 





SQL Server 
在 ORDER BY 子 句 里 使 用 SUBSTRING 国 数 。 


select ename, job 
from emp 
order by substring(job,len(job)-2,2) 
3. 讨论 
利用 数据 库 中 的 子 串 函数 ， 你 可 以 很 方便 地 按照 一 个 字符 囊 的 任意 部 分 来 排序 。 要 想 按照 
一 个 字符 串 的 最 后 两 个 字符 排序 ， 需 要 先 找到 该 字符 串 的 结尾 处 〈 即 字符 串 的 长 度 ) ， 然 























后 减 去 2。 这样， 起 始 位 置 就 是 该 字符 串 的 倒数 第 2 个 字符 。 然 后 ， 你 就 可 以 截取 从 指定 
起 始 位 置 开 始 直到 字符 串 结 束 的 所 有 字符 。SQL Server 的 SUBSTRING 函数 略 有 不 同 ， 它 要 
求 提供 第 3 个 参数 来 指定 需要 截取 几 个 字符 。 对 于 本 实例 而 言 ， 第 3 个 参数 既 可 以 是 2， 
也 可 以 是 任何 大 于 2 的 数字 。 


24 ”对 含有 字母 和 数字 的 列 排序 


1. 问题 
你 有 混合 了 字母 和 数字 的 数据 ， 和 希望 按照 字母 部 分 或 者 数字 部 分 来 排序 。 考 虑 如 下 所 示 的 
视图 。 

create View V 

as 


select ename||' '||deptno as data 
from emp 





select * from V 


SMITH 20 
ALLEN 30 
WARD 30 

JONES 20 
MARTIN 30 
BLAKE 30 
CLARK 10 
SCOTT 20 
KING 10 

TURNER 30 
ADAMS 20 
JAMES 30 
FORD 20 

MILLER 10 


希望 以 DEPTNO 或 ENAME 作为 排序 项 。 若 按照 DEPTN0 排序 ， 会 产生 如 下 所 示 的 结果 集 。 

















= 





CLARK 10 
KING 10 

MILLER 10 
SMITH 20 
ADAMS 20 
FORD 20 

SCOTT 20 
JONES 20 
ALLEN 30 
BLAKE 30 
MARTIN 30 
JAMES 30 
TURNER 30 
WARD 30 
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若 按照 ENAME 排序 ， 会 产生 如 下 所 示 的 结果 集 。 


ADAMS 20 
ALLEN 30 
BLAKE 30 
CLARK 10 
FORD 20 

JAMES 30 
JONES 20 
KING 10 

MARTIN 30 
MILLER 10 
SCOTT 20 
SMITH 20 
TURNER 30 
WARD 30 


2. 解决 方案 
Oracle 和 PostgreSQL 


使 用 函数 REPLACE 和 TRANSLATE 修改 用 于 排序 的 


/* 按照 DEPTNO 排 序 */ 


1 select data 

2 from V 

3 order by replace(data, 

4 replace( 

5 translate(data,'0123456789' 


/* 按照 ENAME 排 序 */ 


1 select data 

2 from emp 

3 order by replace( 

4 translate(data,'012345678 


DB2 


DB2 的 隐 式 类 型 转换 比 Oracle 和 PostgreSQL 更 严格 ， 因 此 在 创建 视 
DEPTNO 的 类 型 转换 为 CHAR。 这 种 方法 没有 创建 一 个 新 视图 





HH 


TER 


= 


, ##########' ) 411 1),11) 


9', HIHHHHHHHHHE ) 4 V7) 


图 V 的 时 候 ， 要 先 将 
， 而 是 直接 使 用 内 租 视 图 。DB2 




















中 的 REPLACE 函数 和 TRANSLATE 函数 的 使 月 
TRANSLATE 函数 的 参数 顺序 稍 有 不 同 。 


/* 按照 DEPTNO 排 序 */ 














select * 
from ( 
selectename| | ' 
from emp 
)v 
order by replace(data, 
replace( 


1 
2 
3 '|[cast(deptno as c 
4 
5 
6 
7 


H7; 3X 5 Oracle 和 PostgreSQL 中 的 相同 ， 只 是 


har(2)) as data 





8 translate(data, '##########" ,'0123456789'),'#',''),'') 


/* 按照 ENAME 排 序 * 


1 select * 

2 from ( 

3 selectename||' '||cast(deptno as char(2)) as data 
4 from emp 

5 )v 

6 

7 


order by replace( 


MySQL 和 SQL Server 
这 些 数据 库 不 支持 TRANSLATE 国 数 ， 因 此 不 能 提供 针对 本 问题 


3. 讨论 





translate(data, '##########' ,'0123456789'),'#','') 


的 解决 方案 。 





使 用 TRANSLATE 函数 和 REPLACE 函数 删除 每 一 行 的 数字 或 者 字符 后 ， 就 能 方便 地 按照 剩 
余 的 部 分 排序 。 上 上 述 示例 代码 里 被 传递 给 ORDER BY 的 值 如 下 述 的 结果 集 所 示 。( 以 Oracle 
解决 方案 为 例 的 原因 是 ， 这 3 种 数据 库 使 用 了 同样 的 技巧 ， 唯 一 特别 之 处 在 于 DB2 的 

















TRANSLATE 函数 的 参数 顺序 略 有 不 同 。) 


select data, 
replace(data, 
replace( 








translate(data,'0123456789' , IHHEHHHHHBHE' ) 341 , ), ' ') nums, 


replace( 
translate(data, '0123456789' , 'IHHHHEHHBHHE' ) , '#' ,'') chars 
from V 
DATA NUMS CHARS 


SMITH 20 20 SMITH 
ALLEN 30 30 ALLEN 
WARD 30 30 WARD 

JONES 20 20 JONES 
MARTIN 30 30 MARTIN 
BLAKE 30 30 BLAKE 


CLARK 10 10 CLARK 
SCOTT 20 20 SCOTT 
KING 10 10 KING 


TURNER 30 30 TURNER 
ADAMS 20 20 ADAMS 
JAMES 30 30 JAMES 
FORD 20 20 FORD 
MILLER 10 10 MILLER 


2.5 排序 时 对 NuLL 值 的 处 理 


1. 问题 





你 想 按照 EMP 表 的 COM 列 对 查询 结果 进行 排序 ， 但 该 字段 可 能 








个 办 法 来 指定 是 否 应 该 将 Null [8 HE# Ji 16 





° 





为 NtL。 因 此 ， 你 需要 想 
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TURNER 1500 0 
ALLEN 1600 300 
WARD 1250 500 
MARTIN 1250 1400 
SMITH 800 
JONES 2975 
JAMES 950 
MILLER 1300 
FORD 3000 
ADAMS 1100 
BLAKE 2850 
CLARK 2450 
SCOTT 3000 
KING 5000 
或 者 你 希望 把 Null 值 放 在 前 面 。 
ENAME SAL COMM 
SMITH 800 
JONES 2975 
CLARK 2450 
BLAKE 2850 
SCOTT 3000 
KING 5000 
JAMES 950 
MILLER 1300 
FORD 3000 
ADAMS 1100 
MARTIN 1250 1400 
WARD 1250 500 
ALLEN 1600 300 
TURNER 1500 0 
2. 解决 方案 





根据 你 希望 的 排序 方式 (以 及 你 所 使 用 的 数据 库 管理 系统 如 何 处 理 Null 值 排序 问题 )， 你 
能 够 对 可 能 为 Null 的 列 进行 升序 排列 或 者 降序 排列 。 
1 select ename,sal,comm 


2 from emp 
3 order by 3 











1 select ename,sal,comm 
2 from emp 
3 order by 3 desc 


这 个 解决 方案 表明 ， 如 果 一 个 可 能 为 Null 的 列 含有 非 NuLL 值 ， 它 们 也 会 相应 地 被 升序 排 
列 或 降序 排列 ， 这 与 你 的 直觉 可 能 相反 。 但 是 ， 如 果 你 希望 采用 与 非 Null 值 列 不 同 的 方式 
来 排列 Null 值 ， 例 如 ， 你 可 能 想 把 非 Null 值 以 升序 排列 或 降序 排列 ， 而 把 全 部 Null 值 都 
放 到 最 后 面 ， 那 么 你 就 要 使 用 CASE 表达 式 来 动态 调整 排序 项 。 
































DB2, MySQL, PostgreSQL 和 SQL Server 

使 用 CASE 表达 式 标记 NuLL 值 。 该 标记 有 两 种 可 能 的 取 值 : 一 种 代表 Null 值 ， 另 一 种 代 
KJE NuLL 值 。 一 旦 你 做 好 了 标记 ， 只 要 简单 地 把 它 放 进 ORDER BY 子 句 就 行 了 。 这 样 一 来 ， 
你 就 能 在 不 影响 非 Null 值 的 情况 下 ， 方 便 地 调整 Null 值 的 位 置 了 。 


/* 非 NuLL 值 COMM 升 序 排列 ,全 部 NuLL 值 放 到 最 后 面 */ 





























1 select ename,sal,comm 
2 from ( 

3 select ename,sal,comm, 
4 case when comm is null then 0 else 1 end as is, null 
5 from emp 

6 )x 

7 


order by is nulldesc,comm 


ENAME SAL COMM 
TURNER 1500 0 
ALLEN 1600 300 
WARD 1250 500 
MARTIN 1250 1400 
SMITH 800 
JONES 2975 
JAMES 950 
MILLER 1300 
FORD 3000 
ADAMS 1100 
BLAKE 2850 
CLARK 2450 
SCOTT 3000 
KING 5000 


/* 非 NuULL 值 COMM 降 序 排列 ,全 部 NuLL 值 放 到 最 后 面 */ 


1 select ename,sal,comm 

2 from ( 

3 select ename,sal,comm, 

4 case when comm is null then O else 1 end as is, null 
5 from emp 

6 )x 

7 order by is, nulldesc,commdesc 
ENAME SAL COMM 

MARTIN 1250 1400 

WARD 1250 500 

ALLEN 1600 300 

TURNER 1500 0 

SMITH 800 

JONES 2975 

JAMES 950 

MILLER 1300 

FORD 3000 

ADAMS 1100 
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BLAKE 2850 


CLARK 2450 
SCOTT 3000 
KING 5000 


/* 非 NuLL 值 COMM 升 序 排列 ,全 部 NuLL 值 放 到 最 前 面 */ 


1 selectename,sal,comm 
2 from ( 

3 selectename,sal,comm, 
4 case when comm is null then 0 else 1 end as is null 
5 from emp 

6 )x 

7 order by is null,comm 
ENAME SAL COMM 
SMITH 800 

JONES 2975 

CLARK 2450 

BLAKE 2850 

SCOTT 3000 

KING 5000 

JAMES 950 

MILLER 1300 

FORD 3000 

ADAMS 1100 

TURNER 1500 0 
ALLEN 1600 300 
WARD 1250 500 
MARTIN 1250 1400 


/* 非 NuLL 值 COMM 降 序 排列 ,全 部 NuLt 值 放 到 最 前 面 */ 





1 selectename,sal,comm 

2 from ( 

3 selectename,sal,comm, 

4 case when comm is null then 0 else 1 end as is null 
5 from emp 

6 )x 

7 order by is null,comm desc 
ENAME SAL COMM 

SMITH 800 

JONES 2975 

CLARK 2450 

BLAKE 2850 

SCOTT 3000 

KING 5000 

JAMES 950 

MILLER 1300 

FORD 3000 

ADAMS 1100 

MARTIN 1250 1400 





WARD 1250 500 


ALLEN 1600 300 
TURNER 1500 0 
Oracle 





如 果 你 使 用 的 是 Oracle 8; 或 者 更 早 的 版 本 ， 可 以 使 用 上 述 针 对 其 他 平台 的 解决 方案 。 如 
果 使 用 的 是 Oracle 9i 及 后 续 版 本 ， 则 能 使 用 针对 ORDER BY 子 句 的 扩展 语法 NULLS FIRST 和 
NULLS LAST 来 决定 Null 值 应 该 排 到 前 面 还 是 后 面 ， 而 无 须 考 虑 非 Null 值 的 排序 方式 。 


/* 非 NuULL 值 COMM 升 序 排列 ,全 部 NuLL 值 放 到 最 后 面 */ 


























1 select ename,sal,comm 
2 from emp 
3 order by comm nulls last 


ENAME SAL COMM 
TURNER 1500 0 
ALLEN 1600 300 
WARD 1250 500 
MARTIN 1250 1400 
SMITH 800 
JONES 2975 
JAMES 950 
MILLER 1300 
FORD 3000 
ADAMS 1100 
BLAKE 2850 
CLARK 2450 
SCOTT 3000 
KING 5000 


/* 非 NuULL 值 COMM 降 序 排列 ,全 部 NuLL 值 放 到 最 后 面 */ 


1 select ename,sal,comm 
2 from emp 
3 order by commdesc nulls last 


ENAME SAL COMM 
MARTIN 1250 1400 
WARD 1250 500 
ALLEN 1600 300 
TURNER 1500 0 
SMITH 800 
JONES 2975 
JAMES 950 
MILLER 1300 
FORD 3000 
ADAMS 1100 
BLAKE 2850 
CLARK 2450 
SCOTT 3000 
KING 5000 





查询 结果 排序 | 21 


/* 非 NuLL 值 COMM 升 序 排列 ,全 部 NuLt 值 放 到 最 前 面 */ 


1 select ename,sal,comm 
2 from emp 
3 order by comm nulls first 


ENAME SAL COMM 
SMITH 800 
JONES 2975 
CLARK 2450 
BLAKE 2850 
SCOTT 3000 
KING 5000 
JAMES 950 
MILLER 1300 
FORD 3000 
ADAMS 1100 
TURNER 1500 0 
ALLEN 1600 300 
WARD 1250 500 
MARTIN 1250 1400 


/* 非 NuLL 值 COMM 降 序 排列 ,全 部 NuLL 值 放 到 最 前 面 */ 


1 select ename,sal,comm 
2 from emp 
3 order by commdesc nulls first 


ENAME SAL COMM 
SMITH 800 
JONES 2975 
CLARK 2450 
BLAKE 2850 
SCOTT 3000 
KING 5000 
JAMES 950 
MILLER 1300 
FORD 3000 
ADAMS 1100 
MARTIN 1250 1400 
WARD 1250 500 
ALLEN 1600 300 
TURNER 1500 0 
3. 讨论 


除非 数据 库 管 理 系统 提供 了 一 种 方式 ， 它 能 够 让 你 在 无 须 修改 非 Null 值 数据 的 情况 下 方便 
地 把 Null 值 排 到 最 前 面 或 者 最 后 面 ( 像 Oracle 那样 ) ， 否 则 你 就 得 添加 一 个 辅助 列 。 


oa 
` 





在 写作 本 书 之 时 ，DB2 用 户 能 够 在 窗口 函数 OVER 子 句 的 ORDER BY 里 使 用 
NULLS FIRST 和 NULLS LAST， 不 过 该 语法 不 适用 于 针对 整个 结果 集 的 ORDER BY 
"" j. 




















辅助 列 (只 存在 于 查询 语句 里 ， 而 不 存在 于 表 中 ) 的 目的 是 ， 让 你 能 够 识别 出 Null fE, JF 








控制 其 排 在 最 前 面 还 是 最 后 面 。 对 于 非 Oracle 解决 方案 的 查询 语句 ， 基 内 柚 视 图 x 会 返回 














如 下 结果 集 。 


select ename,sal,comm, 






































case when comm is null then O else 1 end as is null 


from emp 
ENAME SAL 
SMITH 800 
ALLEN 1600 
WARD 1250 
JONES 2975 
MARTIN 1250 
BLAKE 2850 
CLARK 2450 
SCOTT 3000 
KING 5000 
TURNER 1500 
ADAMS 1100 
JAMES 950 
FORD 3000 


MILLER 1300 





通过 使 用 1S. NULL 返回 的 值 


COMM IS_NULL 

















值 放 到 最 前 面 或 者 最 后 面 。 


2.6 ”依据 条 件 逻 辑 动态 调整 排序 项 


1. 问题 
你 希望 按照 某 个 条 从 





OoccococÍGccocoocomnoeconboncoco 


， 你 就 能 在 不 


影响 COMM 排序 的 情况 下 ， 轻 而 易 举 地 把 全 部 Null 

















逻辑 来 排序 。 例 如 ， 如 果 JOB 等 于 SALESMAN， 就 要 按照 COMM 来 排序 ; 
否则 ， 按 照 SAL 排序 。 你 希望 返回 如 下 所 示 的 结果 集 。 

















TURNER 
ALLEN 
WARD 
SMITH 
JAMES 
ADAMS 
MARTIN 
MILLER 
CLARK 
BLAKE 
JONES 
SCOTT 
FORD 
KING 


SALESMAN 
SALESMAN 
SALESMAN 
CLERK 
CLERK 
CLERK 
SALESMAN 
CLERK 
MANAGER 
MANAGER 
MANAGER 
ANALYST 
ANALYST 
PRESIDENT 


1300 
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2. 解决 方案 
在 ORDER BY 子 句 里 使 用 CASE 表达 式 。 


1 select ename,sal, job ,comm 
2 from emp 
3 order by case when job = 'SALESMAN' then comm else sal end 


3. 讨论 
可 以 利用 CASE 表达 式 来 动态 调整 结果 的 排序 方式 。 上 述 示例 代码 中 传递 给 ORDER BY 的 值 
如 下 所 示 。 


select ename,sal,job,comm, 











case when job = 'SALESMAN' then comm else sal end as ordered 

from emp 

order by 5 
ENAME SAL JOB COMM ORDERED 
TURNER 1500 SALESMAN 0 0 
ALLEN 1600 SALESMAN 300 300 
WARD 1250 SALESMAN 500 500 
SMITH 800 CLERK 800 
JAMES 950 CLERK 950 
ADAMS 1100 CLERK 1100 
MARTIN 1250 SALESMAN 1300 1300 
MILLER 1300 CLERK 1300 
CLARK 2450 MANAGER 2450 
BLAKE 2850 MANAGER 2850 
JONES 2975 MANAGER 2975 
SCOTT 3000 ANALYST 3000 
FORD 3000 ANALYST 3000 
KING 5000 PRESIDENT 5000 
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第 3 章 


多 表 查 询 





本 章 介 绍 如 何 利用 连接 查询 和 集合 运算 来 合并 多 个 表 中 的 数据 。 连 接 查 询 是 SQL 的 基础 ， 
集合 运算 也 非常 重要 。 为 了 掌握 后 续 各 章 介绍 的 更 复杂 的 查询 ， 你 必须 首先 学 习 本 章 中 的 
连接 查询 和 集合 运算 。 


3.1 又 加 两 个 行 集 

1. 问题 

你 想 返 回 保存 在 多 个 表 中 的 数据 ， 理 论 上 需要 将 一 个 结果 集合 加 在 另 一 个 之 上 。 这 些 表 可 
以 没有 相同 的 键 ， 但 它们 的 列 的 数据 类 型 必须 相同 。 例 如 ， 你 想 显示 EMP 表 里 部 门 编号 为 
10 的 员工 的 名 字 和 部 门 编号 ， 以 及 DEPT 表 中 各 个 部 门 的 名 称 和 编写。 你 希望 得 到 如 下 所 
示 的 结果 集 。 


ENAME AND DNAME DEPTNO 

















CLARK 10 
KING 10 
MILLER 10 
ACCOUNTING 10 
RESEARCH 20 
SALES 30 
OPERATIONS 40 
2. 解决 方案 





使 用 集合 运算 UNION ALL 合并 多 个 表 中 的 行 。 


1 select ename as ename_and_dname, deptno 
2 from emp 
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where deptno = 10 

union all 

select '---------- ', null 
from t1 

union all 

select dname, deptno 
from dept 


\D om、~ OA 1 + W 


3. 讨论 
UNION ALL 将 多 个 表 中 的 行 并 入 一 个 结果 集 。 对 于 所 有 的 集合 运算 来 说 ，SELECT 列表 里 的 所 
有 项 目 必须 保持 数目 相同 ， 且 数据 类 型 匹配 。 例 如 ， 下 面 的 两 个 检索 都 将 失败 。 


select deptno 














select deptno，dname 


| 
from dept | from dept 
union all | union 
select ename | select deptno 
from emp | from emp 

















尤其 需要 注意 的 是 ， 如 果 有 重复 项 ，UNION ALL 也 将 一 并 纳入 。 如 果 你 希望 过 滤 掉 重复 项 ， 
可 以 使 用 UNION 运算 符 。 例 如 ， 如 果 针 对 EMP.DEPTNO fH DEPT.DEPTNO 执行 UNION 操作 ， 就 
只 会 返回 如 下 所 示 的 4 行 数据 。 


select deptno 
from emp 
union 

select deptno 
from dept 








DEPTNO 

















使 用 UNION 而 不 是 UNION ALL， 则 很 可 能 会 进行 一 次 排序 操作 ， 以 便 删 除 重复 项 。 当 处 理 大 
型 结果 集 的 时 候 要 想到 这 一 点 。 大 体 而 言 ， 使 用 UNION 等 同 于 针对 UNION ALL 的 输出 结果 
再 执行 一 次 DISTINCT 操作 ， 如 下 所 示 。 


select distinct deptno 
from ( 

select deptno 
from emp 

union all 

select deptno 
from dept ) 

















DEPTNO 








除非 有 必要 ， 否 则 不 要 在 查询 中 使 用 DISTINCT 操作 ， 同 样 的 规则 也 适用 于 UNION。 除 非 有 
必要 ， 否 则 不 要 用 UNION 代替 UNION ALL, 


3.2 合并 相关 行 


1. 问题 

你 想 根据 一 个 共同 的 列 或 者 具有 相同 值 的 列 做 连接 查询 ， 并 返回 多 个 表 中 的 行 。 例 如 ， 你 
想 显示 部 门 编号 为 10 的 全 部 员工 的 名 字 及 其 部 门 所 在 地 ， 但 这 些 数据 分 别 存储 在 两 个 表 
里 。 你 希望 得 到 如 下 所 示 的 结果 集 。 





























ENAME LOC 

CLARK NEW YORK 

KING NEW YORK 

MILLER NEW YORK 
2. 解决 方案 


通过 DEPTNO 字段 把 EMP 表 和 DEPT 表 连 接 起 来 。 


1 select e.ename, d.loc 

2 from emp e, dept d 

3 where e.deptno = d.deptno 
4 and e.deptno = 10 


3. 讨论 
这 个 解决 方案 是 一 个 关于 连接 查询 的 例子 。 更 准确 地 说 ， 它 是 内 连接 中 的 相等 连接 。 连 接 
查询 是 一 种 把 来 自 两 个 表 的 行 合 并 起 来 的 操作 。 对 于 相等 连接 而 言 ， 其 连接 条 件 依赖 于 某 
个 相等 条 件 〈 例 如 ， 一 个 表 的 部 门 编号 和 另 一 个 表 的 部 门 编号 相等 )。 内 连接 是 最 早 的 一 
种 连接 ， 它 返回 的 每 一 行 都 包含 了 来 自 参 与 连接 查询 的 各 个 表 的 数据 。 
理论 上 ， 连 接 操作 首先 会 依据 FROM 子 句 里 列 出 的 表 生 成 第 卡 儿 积 ( 列 出 所 有 可 能 的 行 组 
合 )， 如 下 所 示 。 
select e.ename, d.loc, 
e.deptno as emp_deptno, 
d.deptno as dept_deptno 


from emp e, dept d 
where e.deptno = 10 


























ENAME LOC EMP_DEPTNO DEPT_DEPTNO 
CLARK NEW YORK 10 10 
KING NEW YORK 10 10 
MILLER NEW YORK 10 10 
CLARK DALLAS 10 20 
KING DALLAS 10 20 
MILLER DALLAS 10 20 
CLARK CHICAGO 10 30 
KING CHICAGO 10 30 
MILLER CHICAGO 10 30 








CLARK BOSTON 10 
KING BOSTON 10 
MILLER BOSTON 10 


EMP 表 里 部 门 编号 为 10 的 全 部 员工 与 DEPT 表 的 所 有 部 门 组 合 都 被 列 出 来 了 。 然 后 ， 通 i 


40 
40 
40 











过 


WHERE 子 句 里 的 e.deptno 和 d.deptno 做 连接 操作 ， 限 定 了 只 有 EMP.DEPTNO 和 DEPT .DEPTNO 


LI 


相等 的 行 才 会 被 返回 。 


select e.ename, d.loc, 
e.deptno as emp_deptno, 
d.deptno as dept_deptno 
from emp e, dept d 





where e.deptno = d.deptno 

and e.deptno = 10 
ENAME LOC EMP_DEPTNO DEPT_DEPTNO 
CLARK NEW YORK 10 10 
KING NEW YORK 10 10 
MILLER NEW YORK 10 10 








另 一 种 写法 是 利用 显 式 的 JOIN 子 句 (INNER 关键 字 是 可 选项 ) 。 


select e.ename, d.loc 
from emp e inner join dept d 
on (e.deptno = d.deptno) 
where e.deptno - 10 











如 果 你 更 喜欢 在 FROM 子 句 里 〈 而 不 是 在 WHERE FAE) 写 明 连 接 逻 辑 ， 则 可 以 使 用 JOIN 


子 句 。 这 两 种 风格 都 符合 ANSI 标准 ， 本 和 
持 它们 。 























BB 涉及 的 关系 数据 库 管理 系统 的 最 新 版 本 也 都 








3.3 查找 两 个 表 中 相同 的 行 


1. 问题 


你 想 





create view V 

as 

select ename, job, sal 
from emp 

where job = 'CLERK' 


select * from V 


ENAME JOB SAL 
SMITH CLERK 800 
ADAMS CLERK 1100 
JAMES CLERK 950 
MILLER CLERK 1300 


想 找 出 两 个 表 中 相同 的 行 ， 但 需要 连接 多 列 。 例 如 ， 考 虑 如 下 所 示 的 视图 V. 





> 





视图 V 只 包含 职位 是 CLERK 的 员工 ， 但 并 没有 显示 EMP 表 中 所 有 可 能 的 列 。 你 想 从 EM 表 











获取 与 视图 v 相 匹配 的 全 部 员工 的 EMPNO, ENAME, JOB, SAL 和 DEPTNO， 并 且 希 望 得 到 如 下 
所 示 的 结果 集 。 





EMPNO ENAME JOB SAL DEPTNO 

7369 SMITH CLERK 800 20 

7876 ADAMS CLERK 1100 20 

7900 JAMES CLERK 950 30 

7934 MILLER CLERK 1300 10 
2. 解决 方案 


把 多 个 表 中 所 有 必要 的 列 都 连接 起 来 ， 以 获得 正确 的 结果 。 也 可 以 使 用 集合 运算 
INTERSECT 来 替代 连接 查询 ， 并 返回 两 个 表 的 交集 (相同 的 行 )。 

MySQL 和 SQL Server 

使 用 多 个 条 件 把 EMP 表 和 视图 V 连接 起 来 。 














1 select e.empno,e.ename,e.job,e.sal,e.deptno 
2 from emp e, V 

3 where e.ename = v.ename 
4 and e.job = v.job 
5 and e.sal  - v.sal 


除 此 之 外 ， 也 可 以 使 用 JOIN 子 名 执行 同样 的 连接 查询 。 





1 select e.empno,e.ename,e.job,e.sal,e.deptno 
2 from emp e join V 

3 on ( e.ename = v.ename 

4 and e.job = v.job 

5 and e.sal = v.sal) 


DB2, Oracle 和 PostgreSQL 
针对 MySQL 和 SQL Server 的 解决 方案 也 适用 于 DB2, Oracle 和 PostgreSQL。 如 果 你 希望 
从 视图 V 查询 数据 ， 就 需要 使 用 该 方案 。 


如 果 你 不 需要 检索 视图 V 的 某 些 列 ， 可 以 使 用 集合 运算 INTERSECT 和 谓词 IN, 





























1 select empno,ename,job,sal,deptno 
2 from emp 

3 where (ename,job,sal) in ( 

4 select ename,job,sal from emp 

5 intersect 

6 select ename,job,sal from V 

7 


) 
3. 讨 论 
当 执 行 连接 查询 时 ， 为 了 得 到 正确 的 结果 ， 必 须 慎重 考虑 要 把 哪些 列 作为 连接 项 。 当 参与 
连接 的 行 集 里 的 某 些 列 可 能 有 共同 值 ， 而 其 他 列 有 不 同 值 的 时 候 ， 这 一 点 尤为 重要 。 
集合 运算 INTERSECT 会 返回 两 个 行 集 的 相同 部 分 。 在 使 用 INTERSECT 时 ， 必 须 保 证 两 个 表 
里 参与 比较 的 项 目 数 目 是 相同 的 ， 并 且 数 据 类 型 也 是 相同 的 。 注 意 ， 当 执行 集合 运算 时 ， 
默认 不 会 返回 重复 项 。 
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RR 
PSU 
I 
xf 
N 
NO 


3.4 查找 只 存在 于 一 个 表 中 的 数据 


1. 问题 

你 希望 从 一 个 表 (可 以 称 之 为 源 表 ) 里 找 出 那些 在 某 个 目标 表 里 不 存在 的 值 。 例 如 ， 你 想 
找 出 在 DEPT 表 中 存在 而 在 EMP 表 里 却 不 存在 的 部 门 编号 (如果 有 的 话 )。 在 示例 数据 中 ， 
DEPT 表 里 DEPTNO 为 40 的 数据 并 不 存在 于 EMP 表 里 ， 因 此 结果 集 应 该 如 下 所 示 。 


DEPTNO 






































2. 解决 方案 

计算 差 集 的 函数 对 解决 本 问题 尤其 有 用 。DB2、PostgreSQL 和 Oracle 支持 差 集运 算 。 如 果 
你 所 使 用 的 数据 库 管理 系统 没有 提供 差 集 函 数 ， 那 么 就 要 采用 MySQL 和 SQL Server 解决 
方案 介绍 的 子 查 询 技巧 。 

DB2 和 PostgreSQL 

使 用 集合 运算 EXCEPT。 


1 select deptno from dept 
2 except 
3 select deptno from emp 























Oracle 


使 用 集合 运算 MINUS。 


1 select deptno from dept 
2 minus 
3 select deptno from emp 


MySQL 和 SQL Server 
使 用 子 查询 得 到 EMP 表 中 所 有 的 DEPTNO， 并 将 该 结果 传人 外 层 查询 ， 然 后 外 层 查询 会 检索 
DEPT 表 ， 找 出 没有 出 现在 子 查询 结果 里 的 DEPTNO 值 。 

1 select deptno 


2 from dept 
3 where deptno not in (select deptno from emp) 


3. 讨论 

DB2 和 PostgreSQL 

DB2 和 PostgreSQL 提供 的 内 置 函 数 使 得 该 操作 非常 简单 。EXCEPT 运算 符 获 取 第 一 个 结果 
集 的 数据 ， 然 后 从 中 删除 第 二 个 结果 集 的 数据 。 这 种 运算 非常 像 减 法 。 

包括 EXCEPT 在 内 的 集合 运算 符 在 使 用 上 都 有 一 些 限制 条 件 。 参 与 运算 的 两 个 SELECT 列表 
要 有 相同 的 数据 类 型 和 值 个 数 。 而 且 ，EXCEPT 不 返回 重复 项 ， 并 且 Null 值 不 会 产生 问题 ， 
这 与 NOT IN 子 查询 不 同 (参考 对 MySQL 和 SQL Server 的 讨论 )。EXCEPT 运算 符 会 返回 只 
存在 于 第 一 个 查询 (EXCEPT 前 面 的 查询 ) 结果 里 而 不 存在 于 第 二 个 查询 (EXCEPT 后 面 的 查 
询 ) 结果 里 的 行 。 
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Oracle 
Oracle 解决 方案 除了 集合 运算 符 叫 作 MINUS 而 不 是 EXCEPT， 其 他 方面 与 DB2 和 PostgreSQL 
的 解决 方案 相同 。 另 外 ， 上 述 解 释 也 适用 于 Oracle, 


MySQL 和 SQL Server 
这 个 子 查询 会 获取 EM 表 中 所 有 的 DEPTNO。 外 层 查询 会 返回 DEPT 表 中 “不 存在 于 ”或 “未 
被 包含 在 ” 子 查询 结果 集 里 的 所 有 的 DEPTN0 值 。 


当 你 使 用 MySQL 和 SQL Server 的 解决 方案 时 ， 需 要 考虑 排除 重复 项 。 其 他 数据 库 基 于 
EXCEPT 或 者 MINUS 的 解决 方案 已 经 从 结果 集中 排除 了 重复 的 行 ， 确 保 每 个 DEPTNO 只 出 现 
一 次 。 当 然 ， 之 所 以 能 这 样 做 ， 是 因为 示例 数据 中 的 DEPTNO 是 表 的 主键 。 如 果 DEPTNO 
不 是 主键 ， 你 可 以 使 用 DISTINCT 来 确保 每 个 在 EM 表 里 缺 少 的 DEPTNO 值 只 出 现 一 次 ， 
如 下 所 示 。 

select distinct deptno 


from dept 
where deptno not in (select deptno from emp) 


在 使 用 NOT IN 时 ， 要 注意 NuLL 值 。 考 虑 如 下 的 表 NEW DEPT, 


create table new_dept(deptno integer) 
insert into new dept values (10) 
insert into new dept values (50) 
insert into new dept values (null) 


如 果 你 试 着 使 用 NOT. IN 子 查 询 检索 存在 于 DEPT 表 却 不 存在 于 NEW. DEPT 表 的 DEPTN0， 会 发 
现 查 不 到 任何 值 。 
select * 


from dept 
where deptno not in (select deptno from new dept) 


DEPTNO 7j 20, 30 和 40 的 数据 虽然 不 在 NEW. DEPT 表 中 ， 却 没 被 上 述 查 询 检 索 到 。 原 因 就 在 
于 NEW DEPT 表 里 有 Null 值 。 子 查询 会 返回 3 行 DEPTNO， 分 别 为 10、50 和 Null 值 。IN 和 
NOT IN 本 质 上 是 OR 运算 ， 由 于 Null 值 参 与 0R 逻辑 运算 的 方式 不 同 ，IN 和 NOT IN 将 会 产 
生 不 同 的 结果 。 考 虑 以 下 分 别 使 用 IN 和 OR 的 例子 。 

select deptno 


from dept 
where deptno in ( 10,50,null ) 



















































































































































































DEPTNO 


select deptno 
from dept 
where (deptno-10 or deptno-50 or deptno-null) 


DEPTNO 








再 来 看 看 使 用 NOT IN 和 NOT 0R 的 例子 。 


select deptno 
from dept 
where deptno not in ( 10,50,null ) 


( no rows ) 


select deptno 
from dept 
where not (deptno-10 or deptno-50 or deptno-null) 


( no rows ) 
如 你 所 见 ， 条 件 DEPTNO NOT IN (10, 50, NULL) 等 价 于 : 
not (deptno=10 or deptno=50 or deptno=null) 
对 于 DEPTN0 是 50 的 情况 ， 下 面 是 这 个 表达 式 的 展开 过 程 。 


not (deptno-10 or deptno=50 or deptno=null) 
(false or false or null) 

(false or null) 

null 








在 SQL Hi, TRUE or NULL 的 运算 结果 是 TRUE， 但 FALSE or NULL 的 运算 结果 却 是 Null ! 

旦 混入 了 Null， 结 果 就 会 一 直 保 持 为 Null (除非 你 使 用 实例 1.11 介绍 的 技巧 特意 测试 是 
否 含有 Null)。 必 须 谨 记 ， 当 使 用 IN 谓词 以 及 当 执 行 OR 逻辑 运算 的 时 候 ， 你 要 想到 是 否 
会 涉及 ull fË. 


为 了 避免 NOT IN 和 Null 值 带 来 的 问题 ， 需 要 结合 使 用 NOT EXISTS 和 关联 子 查 询 。 关 联 子 
查询 指 的 是 外 层 查 询 执 行 后 获得 的 结果 集会 被 内 层 子 查 询 引 用 。 下 面 的 例子 给 出 了 一 个 免 
受 Null 值 影响 的 替代 方案 ( 回 到 “问题 ”部 分 给 出 的 那个 原始 查询 语句 )。 


select d.deptno 






































from dept d 
where not exists ( select null 
from emp e 
where d.deptno = e.deptno ) 
DEPTNO 
40 








上 述 查 询 语 名 遍历 并 评估 DEPT 表 的 每 一 行 。 针 对 每 一 行 ， 会 有 如 下 操作 。 

(1) 执 行 子 查询 并 检查 当前 的 部 门 编号 是 否 存 在 于 EMP 表 。 要 注意 关联 条 件 D.DEPTNO = 
E.DEPTN0， 它 通过 部 门 编号 把 两 个 表 连 接 起 来 。 

(2) 如 果子 查询 有 结果 返回 给 外 层 查 询 ， 那 么 EXISTS (...) 的 评估 结果 是 TRUE， 这 样 NOT 
EXISTS (...) 就 是 FALSE， 如 此 一 来 ， 外 层 查 询 就 会 舍弃 当前 行 。 

(3) 如 果子 查询 没有 返回 任何 结果 ， 那 么 NOT EXISTS (...) 的 评估 结果 是 TRUE， 由 此 外 层 查 

询 就 会 返回 当前 行 ( 因 为 它 是 一 个 不 存在 于 EMP 表 中 的 部 门 编号 )。 










































































^ 
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把 EXISTS/NOT EXISTS 和 关联 子 查询 一 起 使 用 时 ，SELECT 列表 里 的 项 目 并 不 重要 ， 因 此 我 
在 这 个 例子 中 用 了 SELECT NULL， 这 是 为 了 让 你 把 注意 力 放 到 子 查询 的 连接 操作 上 ， 而 非 
SELECT 列表 的 项 目 上 。 


3.5 ”从 一 个 表 检索 与 另 一 个 表 不 相关 的 行 


1. 问题 
两 个 表 有 相同 的 键 ， 你 想 在 一 个 表 里 查 找 与 另 一 个 表 不 相 匹配 的 行 。 例 如 ， 你 想 找 出 哪些 
部 门 没 有 员工 。 结 果 集 如 下 所 示 。 


DEPTNO DNAME LOC 


40 OPERATIONS BOSTON 


如 果 想 要 找到 每 一 个 员工 就 职 的 部 门 ， 需 要 基于 EM RAN DEPT 表 的 DEPTN0 列 进 行 相 等 连 
接 查 询 。DEPTN0 是 两 个 表 都 有 的 列 。 不 幸 的 是 ， 相 等 连接 无 法 找到 哪些 部 门 没 有 员工 。 这 
是 因为 ， 针 对 EMP 表 和 DEPT 表 做 相等 连接 操作 ， 将 返回 满足 连接 条 件 的 所 有 行 。 相 反 ， 你 
只 想 从 DEPT 表 里 找 出 那些 不 满足 连接 条 件 的 行 


本 问题 年 看 起 来 和 前 一 个 实例 相同 ， 但 其 实 它们 之 间 有 微妙 的 差别 。 不 同 之 处 在 于 ， 前 一 
个 实例 仅仅 返回 了 没有 出 现在 EMP 表 中 的 部 门 编号 。 然 而 ， 本 实例 可 以 很 方便 地 从 DEPT 表 
中 获取 其 他 列 。 

2. 解决 方案 


基于 共同 列 把 两 个 表 连 接 起 来 ， 返 回 一 个 表 的 所 有 行 ， 不 论 这 些 行 在 另 一 个 表 里 是 否 存在 
匹配 行 。 然 后 ， 只 保留 那些 不 匹配 的 行 即 可 。 


DB2, MySQL, PostgreSQL 和 SQL Server 
使 用 外 连接 并 过 滤 掉 Null 值 (关键 字 OUTER 是 可 选 的 )。 


1 select d.* 

2 from dept d left outer join emp e 
3 on (d.deptno = e.deptno) 

4 where e.deptno is null 





















































Oracle 
对 于 Oracle 9i 及 其 后 续 版 本 ， 上 述 解决 方案 仍然 适用 。 当 然 ， 你 也 可 以 使 用 Oracle 专 有 的 
外 连接 语法 。 

1 select d.* 

2 from dept d, emp e 


3 where d.deptno = e.deptno (+) 
4 and e.deptno is null 


Oracle 8i 数据 库 及 更 早 的 版 本 只 能 使 用 上 述 专 有 语法 (注意 ， 圆 括号 里 是 +) 来 完成 外 连 
接 操 作 。 











3. 讨论 
文 个 解决 方案 使 用 了 外 连接 ,并 且 只 保留 不 匹配 的 行 。 这 种 操作 有 时 候 被 称 为 反 连 接 (anti- 
join)。 为 了 更 好 地 理解 反 连 接 ， 我 们 先 来 看 一 下 没有 过 滤 掉 Null 值 的 结果 集 。 


select e.ename, e.deptno as emp_deptno, d.* 
from dept d left join emp e 
on (d.deptno = e.deptno) 























ENAME EMP_DEPTNO DEPTNO DNAME LOC 
SMITH 20 20 RESEARCH DALLAS 
ALLEN 30 30 SALE CHICAGO 
WARD 30 30 SALES CHICAGO 
JONES 20 20 RESEARCH DALLAS 
MARTIN 30 30 SALES CHICAGO 
BLAKE 30 30 SALES CHICAGO 
CLARK 10 10 ACCOUNTING NEW YORK 
SCOTT 20 20 RESEARCH DALLAS 
KING 10 10 ACCOUNTING NEW YORK 
TURNER 30 30 SALES CHICAGO 
ADAMS 20 20 RESEARCH DALLAS 
JAMES 30 30 SALES CHICAGO 
FORD 20 20 RESEARCH DALLAS 
MILLER 10 10 ACCOUNTING NEW YORK 
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注意 ， 最 后 一 行 的 EMP.ENAME 和 EMP. DEPTNO 都 是 Null 值 。 这 是 因为 没有 员工 在 编号 为 40 
的 部 门 工作 。 该 解决 方案 使 用 WHERE 子 句 ， 只 保留 了 EMP_DEPTNO 是 Null 值 的 行 (这 样 只 
留 下 DEPT 表 中 无 法 与 EM 表 相 匹配 的 行 )。 


36 ”新 增 连接 查询 而 不 影响 其 他 连接 查询 


1. 问题 

你 已 经 有 了 一 个 查询 语句 ， 它 可 以 返回 你 想 要 的 数据 。 你 需要 一 些 额外 信息 ， 但 当 你 试 医 
获取 这 些 信息 的 时 候 ， 却 丢失 了 原 有 的 查询 结果 集中 的 数据 。 例 如 ， 你 想 查找 所 有 员工 的 
信息 ， 包 括 他 们 所 在 部 门 的 位 置 ， 以 及 他 们 收 到 奖金 的 日 期 。 针 对 这 个 问题 ，EMP_BONUS 
表 包 含 了 如 下 数据 。 


select * from emp_bonus 

















EMPNO RECEIVED TYPE 
7369 14-MAR-2005 1 
7900 14-MAR-2005 2 
7788 14-MAR-2005 3 


最 初 ， 你 使 用 如 下 所 示 的 查询 语句 。 


select e.ename, d.loc 
from emp e, dept d 
where e.deptno=d.deptno 





MARTIN 
BLAKE 
CLARK 
SCOTT 
KING 
TURNER 
ADAMS 
JAMES 
FORD 
MILLER 


对 于 有 奖金 的 员工 ， 你 希望 把 他 们 收 到 奖金 的 日 期 也 添加 到 结果 集 昌 





DALLAS 
CHICAGO 
CHICAGO 
DALLAS 
CHICAGO 
CHICAGO 
NEW YORK 
DALLAS 
NEW YORK 
CHICAGO 
DALLAS 
CHICAGO 
DALLAS 
NEW YORK 


BONUS 表 后 得 到 的 行 数 却 比 预期 的 要 少 ， 因 为 并 非 所 有 的 员工 都 有 奖金 。 


select e.ename, d.loc,eb.received 
from emp e, dept d, emp bonus eb 


where e.deptno-d.deptno 
and e.empnozeb.empno 





RECEIVED 


DALLAS 
DALLAS 
CHICAGO 


14-MAR-2005 
14-MAR-2005 
14-MAR-2005 


而 你 希望 得 到 如 下 所 示 的 结果 集 。 


RECEIVED 


WARD 
MARTIN 
JAMES 
TURNER 
BLAKE 
SMITH 
FORD 
ADAMS 
JONES 
SCOTT 
CLARK 
KING 
MILLER 


2. 解 决 方案 


CHICAGO 
CHICAGO 
CHICAGO 
CHICAGO 
CHICAGO 
CHICAGO 
DALLAS 
DALLAS 
DALLAS 
DALLAS 
DALLAS 
NEW YORK 
NEW YORK 
NEW YORK 


14-MAR-2005 


14-MAR-2005 


14-MAR-2005 





， 但 连接 了 EMP_ 


使 用 外 连接 既 能 够 获得 额外 信息 ， 又 不 会 丢失 原 有 的 信息 。 首 先 连接 EM 表 和 DEPT 表 ， 得 

















到 全 部 员工 和 他 们 所 在 部 门 的 位 置 。 然 后 外 连接 EMP_BONUS 表 ， 如 果 某 个 员工 有 奖金 ， 则 
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检索 其 收 到 奖金 的 日 期 。 下 面 是 DB2, MySQL, PostgreSQL 以 及 SQL Server 的 查询 语法 。 











1 select e.ename, d.loc, eb.received 
2 from emp e join dept d 

3 on (e.deptno-d.deptno) 

4 left join emp bonus eb 

5 on (e.empnozeb.empno) 

6 order by 2 


对 于 Oracle 9i 数据 库 及 其 后 续 版 本 ， 上 述 解决 方案 仍然 适用 。 除 此 之 外 ， 对 于 Oracle 8i 数 
据 库 及 更 早 的 版 本 ， 可 以 使 用 Oracle 专 有 的 外 连接 语法 。 





1 select e.ename, d.loc, eb.received 
2 from emp e, dept d, emp bonus eb 
3 where e.deptno-d.deptno 

4 and e.empno-eb.empno (+) 

5 order by 2 


也 可 以 使 用 标量 子 查询 〈 即 把 子 查询 放置 在 SELECT 列表 里 ) 来 模仿 外 连接 操作 。 


1 select e.ename, d.loc, 

2 (select eb.received from emp bonus eb 
3 where eb.empno-e.empno) as received 
4 from emp e, dept d 

5 where e.deptnozd.deptno 

6 order by 2 


标量 子 查询 解决 方案 适用 于 所 有 数据 库 。 
3. 讨论 

外 连接 查询 会 返回 一 个 表 中 的 所 有 行 ， 以 及 另 一 个 表 中 与 之 匹配 的 行 。 上 一 个 实例 中 也 出 
现 了 这 种 连接 操作 。 外 连接 之 所 以 能 够 解决 本 问题 ， 是 因为 它 不 会 过 污 掉 任何 应 该 被 返回 
的 行 。 上 述 外 连接 查询 返回 的 行 数 和 没有 外 连接 时 一 样 多 。 而 且 ， 如 果 有 收 到 奖金 的 日 
期 ， 它 也 会 返回 那个 日 期 。 
使 用 标量 子 查询 是 解决 本 问题 的 一 种 巧妙 做 法 ， 因 为 不 需要 修改 主 查 询 中 正确 的 连接 操 
作 。 在 不 破坏 当前 结果 集 的 情况 下 ， 标 量子 查询 是 为 现 有 查询 语句 添加 额外 数据 的 好 办 
法 。 当 使 用 标量 子 查 询 时 ， 必 须 确保 它们 返回 的 是 标量 值 ( 单 值 )。 如 果 SELECT 列表 里 的 
子 查 询 返 回 多 行 ， 那 么 查询 将 会 出 错 。 

4. 参考 资料 

关于 如 何 解 决 SELECT 列表 里 的 子 查 询 不 能 返回 多 行 数据 的 问题 ， 参 见 14.10 53, 


3.7 ”确定 两 个 表 是 否 有 相同 的 数据 
1. 问题 
你 想 知 道 两 个 表 或 两 个 视图 里 是 否 有 相同 的 数据 ( 行 数 和 值 )。 考 虑 如 下 所 示 的 视图 。 


create view V 
as 
select * from emp where deptno != 10 

































































~ 
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union all 


select * from emp where ename - 


select * fro 


EMPNO ENAME 


7654 MARTIN 
7698 BLAKE 
7788 SCOTT 
7844 TURNER 
7876 ADAMS 
7900 JAMES 
7902 FORD 

7521 WARD 


m V 


CLERK 
SALESMAN 
SALESMAN 
MANAGER 
SALESMAN 
MANAGER 
ANALYST 
SALESMAN 
CLERK 
CLERK 
ANALYST 
SALESMAN 


'WARD' 


MGR HIREDATE 


7566 
7698 


17-DEC-1980 
20-FEB-1981 
22-FEB-1981 
02-APR-1981 
28-SEP-1981 
01-MAY-1981 
09-DEC-1982 
08-SEP-1981 
12-JAN-1983 
03-DEC-1981 
03-DEC-1981 
22-FEB-1981 


SAL COMM DEPTNO 





你 希望 确定 该 视图 是 否 和 EMP 表 有 完全 相同 的 数 


这 表明 相应 的 解决 方案 不 仅 要 找 





来 不 同 的 数据 ， 








MGR HIREDATE 


17-NOV-1981 


7782 23-JAN-1982 





500 


B, 与 员工 WARD 相关 的 数据 有 两 行 ， 
还 要 找到 重复 的 数据 。 根 据 EMP 表 的 数 


SAL 





COMM DEPTNO CNT 
7698 22-FEB-1981 
7698 22-FEB-1981 
7839 09-JUN-1981 


据 ， 二 者 的 不 同 之 处 包括 3 行 部 门 编号 为 10 的 数据 以 及 两 行 员工 WARD 的 数据 。 你 希望 


使 用 求 差 集 的 函数 (MINUS 或 EXCEPT， 这 取决 于 你 使 用 的 数据 库 管 理 系 统 ) 可 以 很 容易 地 


返回 如 下 所 示 的 结果 集 。 
EMPNO ENAME JOB 
7521 WARD SALESMAN 
7521 WARD SALESMAN 
7782 CLARK MANAGER 
7839 KING PRESIDENT 
7934 MILLER CLERK 
2. 解决 方案 
比较 表 中 的 数据 。 如 果 你 所 使 用 的 数 扫 
查询 。 
DB2 和 PostgreSQL 
使 用 集合 运算 EXCEPT 和 UNION ALL 找 出 视 
1 ( 
2 select 
3 count(*) as cnt 
4 from V 
5 group 
6 except 
7 select 
8 count(*) as cnt 
9 from emp 
10 group 
11 ) 
12 union all 


empno,ename, job,mgr,hiredate,sal,comm,deptno, 


by empno,ename, job,mgr,hiredate,sal,comm,deptno 


empno,ename, job,mgr,hiredate,sal,comm,deptno, 


by empno,ename, job,mgr ,hiredate,sal,comm,deptno 
































图 V 和 EMP 表 的 不 同 之 处 。 


居 库 管理 系统 没有 提供 类 似 功 能 ， 则 可 以 使 月 





HS" 
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13 ( 
14 select empno,ename, job,mgr,hiredate,sal,comm,deptno, 





15 count(*) as cnt 
16 from emp 
17 group by empno,ename, job,mgr,hiredate,saL,comm,deptno 
18 except 
19 select empno,ename, job,mgr,hiredate,saL,comm,deptno， 
20 count(*) as cnt 
21 from V 
22 group by empno,ename, job,mgr ,hiredate,sal,comm,deptno 
23 ) 

Oracle 

使 用 集合 运算 MINUS 和 UNION ALL 找 出 视图 V 和 EMP 表 的 不 同 之 处 。 
1 ( 
2 select empno,ename, job,mgr ,hiredate,sal,comm,deptno, 
3 count(*) as cnt 
4 from V 
5 group by empno,ename, job,mgr ,hiredate,sal,comm,deptno 
6 minus 
7 select empno,ename, job,mgr ,hiredate,sal,comm,deptno, 
8 count(*) as cnt 
9 from emp 
10 group by empno,ename, job,mgr ,hiredate,sal,comm,deptno 
11 ) 
12 union all 
13 ( 
14 select empno,ename, job,mgr,hiredate,sal,comm,deptno, 
15 count(*) as cnt 
16 from emp 
17 group by empno,ename, job,mgr ,hiredate,sal,comm,deptno 
18 minus 
19 select empno,ename, job,mgr,hiredate,sal,comm,deptno, 
20 count(*) as cnt 
21 from v 
22 group by empno,ename, job,mgr ,hiredate,sal,comm,deptno 
23 ) 

MySQL 和 SQL Server 











使 用 关联 子 查 询 和 UNION ALL 找 出 那些 存在 于 视图 V 而 不 存在 于 EMP 表 的 数据 ， 以 及 存在 
于 EMP 表 而 不 存在 于 视图 V 的 数据 ， 并 将 它们 合并 起 来 。 














1 select * 

2 from ( 

3 select e.empno,e.ename,e.job,e.mgr,e.hiredate, 
4 e.sal,e.comm,e.deptno, count(*) as cnt 
5 from emp e 

6 group by empno,ename, job,mgr ,hiredate, 

7 sal,comm,deptno 

8 )e 

9 where not exists ( 

10 select null 

11 from ( 





12 
13 
14 
15 
16 
17 
18 
19 
20 
21 
22 
23 
24 
25 
26 
27 
28 
29 
30 
31 
32 
33 
34 
35 
36 
37 
38 
39 
40 
41 
42 
43 
44 
45 
46 
47 
48 
49 
50 
51 
52 
53 
54 
55 


3. 讨论 


select 


from 
group 


where 
and 
and 
and 
and 
and 
and 
and 
and 

) 
union 
select 
from 
select 


from 
group 


where 
select 
from 
select 


from 
group 


where 
and 
and 
and 
and 
and 
and 
and 
and 


v.empno,v.ename,v.job,v.mgr,v.hiredate, 
v.sal,v.comm,v.deptno, count(*) as cnt 
v 

by empno,ename, job,mgr ,hiredate, 


sal,comm,deptno 
)v 
v.empno - e.empno 
v.ename - e.ename 
v. job - e.job 
v.mgr - e.mgr 
v.hiredate = e.hiredate 
v.sal - e.sal 
v.deptno  - e.deptno 
v.cnt - e.cnt 


coalesce(v.comm,0) - coalesce(e.comm,0) 


all 


* 


( 

v.empno,v.ename,v.job,v.mgr,v.hiredate, 

v.sal,v.comm,v.deptno, count(*) as cnt 

v 

by empno,ename,job,mgr,hiredate, 
sal,comm,deptno 

)v 

not exists ( 

null 

( 

e.empno,e.ename,e.job,e.mgr,e.hiredate, 

e.sal,e.comm,e.deptno, count(*) as cnt 


emp e 

by empno,ename, job,mgr,hiredate, 
sal,comm,deptno 

je 

v.empno - e.empno 

v.ename - e.ename 

v. job - e.job 

v.mgr - e.mgr 

v.hiredate = e.hiredate 

v.sal - e.sal 

v.deptno = e.deptno 

v.cnt - e.cnt 


coalesce(v.comm,0) - coalesce(e.comm,0) 














尽管 使 用 了 不 同 的 方法 ， 但 上 述 解决 方案 的 原理 并 无 差别 。 
(D 首 先 ， 找 出 存在 于 EMP 表 而 不 存在 于 视图 V 的 行 ， 





(2) 然后 与 存在 于 视图 V 而 不 存在 于 EM 表 的 行 合并 (UNION ALL), 





























如 有 果 两 个 表 完 全 相同 ， 则 不 会 返回 任何 数据 。 如 果 两 个 表 有 不 同 之 处 ， 那 么 将 返回 那些 不 


同 的 行 。 在 比较 两 个 表 的 时 候 ， 比 较 容 易 的 做 法 是 ， 在 比较 数据 之 前 先 单独 
面 是 一 个 行 数 比较 的 简单 示例 ， 适 用 于 所 有 数据 库 管理 











系统 。 








比较 行 数 。 下 





RR 
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select count(*) 
from emp 
union 

select count(*) 
from dept 


COUNT(*) 





因为 UNION 子 句 会 过 滤 掉 重复 项 ， 所 以 如 果 两 个 表 的 行 数 相同 ， 则 只 会 返回 一 行 数据 。 本 
例 中 返回 了 两 行 数据 ， 这 说 明 两 个 表 中 没有 完全 相同 的 数据 。 
DB2. Oracle 和 PostgreSQL 
MINUS 和 EXCEPT 的 作用 相同 ， 所 以 这 里 只 讨论 EXCEPT。UNION ALL 前 后 的 两 个 查询 语句 非常 
相似 。 因 此 ， 为 了 说 明 这 个 解决 方案 的 原理 ， 我 们 将 直接 执行 位 于 UNION ALL 前 面 的 那个 
查询 。 执 行 第 1 行 至 第 11 行 后 产生 的 结果 集 如 下 所 示 。 
( 
select empno,ename,job,mgr,hiredate,saL,comm,deptno， 
count(*) as cnt 
from V 
group by empno,ename,job,mgr,hiredate,sal,comm,deptno 
except 


select empno,ename,job,mgr,hiredate,saL,comm,deptno， 
count(*) as cnt 





























from emp 

group by empno,ename,job,mgr,hiredate,sal,comm,deptno 
) 
EMPNO ENAME JOB MGR HIREDATE SAL COMM DEPTNO CNT 
7521 WARD SALESMAN 7698 22-FEB-1981 1250 500 30 2 














上 述 结果 集 显 示 从 视图 V 中 查询 到 了 一 行 数据 ， 该 行 数据 要 么 不 存在 于 EMP 表 ， 要 么 它 在 
视图 V 中 出 现 的 次 数 与 EMP 表 中 的 不 一 致 。 对 于 本 例 而 言 ， 查 询 找到 了 员工 WARD WE 
复 行 。 如 果 你 仍然 不 理解 该 结果 集 是 如 何 产 生 的 ， 可 以 分 别 执行 位 于 EXCEPT 前 后 的 两 个 查 
询 。 你 会 发 现 ， 两 个 结果 集 的 不 同 之 处 仅仅 在 于 视图 V 中 员工 WARD 相关 行 的 CNT 值 。 


位 于 UNION ALL 后 面 的 查询 语句 执行 了 和 UNION ALL 前 面 的 查询 相反 的 操作 。 该 查询 找 出 了 
那些 存在 于 EMP 表 而 不 存在 于 视图 V 的 行 。 


( 
select empno,ename,job,mgr,hiredate,saL,comm,deptno， 
count(*) as cnt 
from emp 
group by empno,ename,job,mgr,hiredate,sal,comm,deptno 
minus 
select empno,ename, job,mgr,hiredate,sal,comm,deptno, 
count(*) as cnt 
from v 
group by empno,enanme, job,mgr,hiredate,sal,comm,deptno 


















































) 





EMPNO ENAME JOB MGR HIREDATE SAL COMM DEPTNO CNT 
7521 WARD SALESMAN 7698 22-FEB-1981 1250 500 30 1 
7782 CLARK MANAGER 7839 09-JUN-1981 2450 10 1 
7839 KING PRESIDENT 17-NOV-1981 5000 10 1 
7934 MILLER CLERK 7782 23-JAN-1982 1300 10 1 
上 述 两 个 结果 集 通 过 UNION ALL 合并 后 即 可 得 到 最 终 的 结果 集 。 
MySQL 和 SQL Server 

















位 于 UNION ALL 前 后 的 两 个 查询 语句 非常 相似 。 为 了 理解 基于 子 查询 的 解决 方案 ， 我 们 直 
接 执行 UNION ALL 前 面 的 查询 。 下 面 的 查询 是 第 1 行 至 第 27 行 的 内 容 。 


select * 
from ( 
select e.empno,e.ename,e.job,e.mgr,e.hiredate, 
e.sal,e.comm,e.deptno, count(*) as cnt 
from emp e 
group by empno,ename, job,mgr ,hiredate, 
Ssal,comm,deptno 
)e 
where not exists ( 
select null 
from ( 
select v.empno,v.ename,v.job,v.mgr,v.hiredate, 
v.sal,v.comm,v.deptno, count(*) as cnt 

















from v 
group by empno,ename, job,mgr,hiredate, 
Sal,comm,deptno 
)v 
where v.empno = e.empno 
and v.ename = e.ename 
and v.job = e.job 
and v.mgr = e.mgr 
and v.hiredate - e.hiredate 
and v.sal = e.sal 
and v.deptno = e.deptno 
and v.cnt = e.cnt 
and coalesce(v.comm,0) = coalesce(e.comm,0) 

) 

EMPNO ENAME JOB MGR HIREDATE SAL COMM DEPTNO CNT 
7521 WARD SALESMAN 7698 22-FEB-1981 1250 500 30 1 
7782 CLARK MANAGER 7839 09-JUN-1981 2450 10 1 
7839 KING PRESIDENT 17-NOV-1981 5000 10 1 
7934 MILLER CLERK 7782 23-JAN-1982 1300 10 1 
































注意 ， 这 里 比较 的 不 是 EM RIA V, MENRE ERARI Vv。 计 算出 每 一 行 数 据 
出 现 的 次 数 ， 并 作为 查询 结果 的 一 列 返 回 。 我 们 要 比较 每 一 行 的 数据 及 其 出 现 的 次 数 。 如 
果 你 还 是 不 理解 比较 操作 是 如 何 执行 的 ， 不 妨 单独 执行 两 个 子 查 询 。 下 一 步 是 找 出 存在 于 
ARAILE E 而 不 存在 于 内 符 视 图 V 的 所 有 行 (包括 CNT) 。 该 操作 使 用 了 关联 子 查询 和 NOT 
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EXISTS。 连 接 查 询 将 确定 哪些 行 是 相同 的 ，NOT EXISTS Nj fi: IH ARRE E 中 与 连接 查询 
结果 不 匹配 的 行 。UNION ALL 后 面 的 查询 语句 做 了 相反 的 操作 ， 它 找 出 了 所 有 存在 于 内 艇 视 
VIA EE PARAL E 的 行 。 


select * 
from ( 
select v.empno,v.ename,v.job,v.mgr,v.hiredate, 
v.sal,v.comm,v.deptno, count(*) as cnt 
from v 
group by empno,enanme, job,mgr,hiredate, 
sal,comm,deptno 
)v 
where not exists ( 
select null 
from ( 
select e.empno,e.ename,e.job,e.mgr,e.hiredate, 
e.sal,e.comm,e.deptno, count(*) as cnt 























from emp e 

group by empno,ename, job,mgr,hiredate, 
sal,comm,deptno 
)e 

where v.empno = e.empno 

and v.ename = e.ename 

and v.job = e.job 

and v.mgr = e.mgr 

and v.hiredate - e.hiredate 

and v.sal = e.sal 

and v.deptno = e.deptno 

and v.cnt = e.cnt 

and coalesce(v.comm,0) = coalesce(e.comm,0) 
) 
EMPNO ENAME JOB MGR HIREDATE SAL COMM DEPTNO CNT 
7521 WARD SALESMAN 7698 22-FEB-1981 1250 500 30 2 

















最 后 ， 使 用 UNION ALL 合并 两 个 结果 集 ， 即 可 得 到 最 终 的 结果 集 


» a 


Ales Spetic 和 Jonathan Gennick 在 Transact-SQL Cookbook 一 书 中 给 出 了 另 一 
， 种 解决 方案 。 i 请 参考 这 本 书 第 2 “Comparing Two Sets for Equality” 一 节 。 


3.8 j 只 别 并 消 除 笛 卡 儿 积 

1. 问题 
你 想 找 出 部 门 编号 为 10 的 所 有 员工 的 名 字 及 其 部门 所 在 的 城市 。 下 面 的 查询 返回 的 数据 
是 错误 的 。 


select e.ename, d.loc 
from emp e, dept d 
where e.deptno = 10 









































CLARK NEW YORK 
CLARK DALLAS 
CLARK CHICAGO 
CLARK BOSTON 
KING NEW YORK 
KING DALLAS 
KING CHICAGO 
KING BOSTON 


MILLER NEW YORK 
MILLER DALLAS 
MILLER CHICAGO 
MILLER BOSTON 


正确 的 结果 集 如 下 所 示 。 
ENAME LOC 
CLARK NEW YORK 
KING NEW YORK 
MILLER NEW YORK 
2. 解决 方案 


在 FROM 子 句 里 对 两 个 表 执 行 连接 查询 ， 以 得 到 正确 的 结果 集 。 


1 select e.ename, d.loc 

2 from emp e, dept d 

3 where e.deptno = 10 

4 and d.deptno = e.deptno 
3. 讨论 
先 看 一 下 DEPT 表 的 数据 。 


select * from dept 








DEPTNO DNAME LOC 


10 ACCOUNTING NEW YORK 
20 RESEARCH DALLAS 
30 SALES CHICAGO 
40 OPERATIONS BOSTON 


我 们 看 到 ， 编 号 为 10 的 部 门 位 于 纽约 ， 因 此 如 果 查 询 结果 不 是 纽约 ， 那 就 出 错 了 。 上 述 
那个 错误 的 查询 语句 返回 的 结果 行 数 是 FROM 子 句 里 两 个 表 的 行 数 的 乘积 。 对 于 该 查询 而 
言 ， 依 据 EMP 表 的 部 门 编号 等 于 i10 这 一 过 滤 条 件 ， 将 产生 3 行 结果 。 但 是 ， 由 于 没有 对 
DEPT 表 做 条 件 过 让， 因此 DEPT 表 中 的 全 部 4 行 数据 都 将 被 返回 。3 乘 以 4 等 于 12， 因 此 
上 述 错误 的 查询 语句 会 返回 12 行 数据 。 为 了 消除 第 卡 儿 积 ， 我 们 通常 会 用 到 n-1 法 则 ， 
其 中 代表 FROM 子 句 里 表 的 个 数 ，n-1 则 代表 消除 笛 卡 儿 积 所 必需 的 连接 查询 的 最 少 次 
数 。 依 据 表 里 有 什么 样 的 键 以 及 基于 哪些 列 来 实现 表 之 间 的 连接 操作 ， 有 时 候 必 要 的 连接 
查询 次 数 可 能 会 超过 n-1 次 ,但 是 当 我 们 编写 查询 语句 的 时 候 ，n-1 法 则 仍然 是 一 个 很 好 
的 指导 原则 。 
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若 使 用 得 当 ， 笛 卡 儿 积 会 很 有 用 。 这 一 方法 被 广泛 运用 于 多 种 查询 中 。 笛 卡 
。 儿 积 常 用 于 变换 或 展开 《以 及 合并 ) 结果 集 ， 生 成 一 系列 的 值 ， 以 及 模拟 
- loop 循环 。 


3.9 组 合 使 用 连接 查询 与 聚合 函数 


1. 问题 

i a ean a 但 查询 语句 涉及 多 个 表 。 你 希望 确保 表 之 间 的 连接 查询 不 会 干扰 
聚合 操作 。 例 如 ， 你 希望 计算 部 门 编号 为 10 的 员工 的 工资 总 额 以 及 奖金 总 和 。 因 为 有 部 

分 员工 多 次 获得 得 奖金 ， 所 以 在 EMP RFH EMP_BONUS 表 连 接 之 后 再 执行 聚合 函数 SUM， 就 会 得 

出 错误 的 计算 结果 。 在 这 个 问题 中 ，EMP_BONUS 表 里 有 如 下 数据 。 


select * from emp_bonus 









































EMPNO RECEIVED TYPE 


7934 17-MAR-2005 1 
7934 15-FEB-2005 2 
7839 15-FEB-2005 3 
7782 15-FEB-2005 1 


现在 ， 考 虑 下 面 的 查询 语句 ， 它 返回 了 部 门 编号 为 10 的 所 有 员工 的 工资 和 奖金 。BONUS K 
中 的 TYPE 列 决定 了 奖金 的 数额 。 若 TYPE 值 等 于 1， 则 奖金 为 工资 的 10%; 车 TYPE 值 等 于 
2， 则 奖金 为 工资 的 20%; 车 TYPE 值 等 于 3， 则 奖金 为 工资 的 30%。 


select e.empno, 





e.ename, 
e.sal, 
e.deptno, 
e.sal*case when eb.type = 1 then .1 
when eb.type = 2 then .2 
else .3 
end as bonus 
from emp e, emp bonus eb 
where e.empno = eb.empno 
and e.deptno - 10 
EMPNO ENAME SAL DEPTNO BONUS 
7934 MILLER 1300 10 130 
7934 MILLER 1300 10 260 
7839 KING 5000 10 1500 
7782 CLARK 2450 10 245 





到 目前 为 止 ， 一 切 都 很 顺利 。 然 而 ， 如 果 你 试图 连接 EMP. BONUS 表 并 计算 奖金 总 和 ， 就 会 
出 错 。 


select deptno， 
sum(sal) as total_sal, 
sum(bonus) as total_bonus 
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from ( 
select e.empno, 
e.ename, 
e.sal, 
e.deptno, 
e.sal*case when eb.type = 1 then .1 
when eb.type = 2 then .2 


else .3 
end as bonus 
from emp e, emp_bonus eb 
where e.empno eb.empno 
and e.deptno = 10 
)x 
group by deptno 


DEPTNO TOTAL_SAL TOTAL_BONUS 


尽管 奖金 总 额 (TOTAL_BONUS) 是 正确 的 ， 但 工资 总 额 (TOTAL SAL) 却 是 错误 的 。 部 门 编 
号 为 10 的 所 有 员工 的 工资 总 额 应 该 是 8750, AH HIR. 


select sum(sal) from emp where deptno=10 


SUM(SAL) 








E 




















为 什么 工资 总 额 不 对 呢 ? 这 是 因为 连接 查询 导致 某 些 行 的 SAL 列 出 现 了 两 次 。 考 虑 下 面 
接 EMP 表 和 EMP_BONUS 表 的 查询 语句 。 
select e.ename, 


e.sal 
from emp e, emp_bonus eb 





where e.empno = eb.empno 
and e.deptno = 10 
ENAME SAL 
CLARK 2450 
KING 5000 
MILLER 1300 
MILLER 1300 


现在 就 能 很 容易 地 看 出 来 为 什么 工资 总 额 是 错误 的 了 ， 因 为 MILLER 的 工资 被 统计 了 两 
次 。 你 真正 想 要 的 结果 集 应 该 如 下 所 示 。 


DEPTNO TOTAL_SAL TOTAL_BONUS 

















2. 解决 方案 
在 连接 查询 里 进行 聚合 运算 时 ， 必 须 十 分 小 心 才 行 。 如 果 连 接 查 询 产 生 了 重复 行 ， 通 常 有 
两 种 办 法 来 使 用 聚合 国 数 ， 而 且 可 以 避免 得 出 错误 的 计算 结果 。 一 种 方法 是 ， 调 用 聚合 国 
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数 时 直接 使 用 关键 字 DISTINCT, 
是 ， 在 进行 连接 查 

















询 之 前 先 执行 聚合 运算 (AARIN 





图 的 方式 )， 


这 样 每 个 值 都 会 先 去 掉 重 复 项 再 参与 计算 ， 另 一 种 方法 
这 样 可 以 避免 错误 的 结 


果 ， 因 为 聚合 运算 发 生 在 连接 查询 之 前 。 下 面 的 解决 方案 使 用 了 DISTINCT。 之 后 ， 我 们 将 








讨论 在 连接 查询 之 前 使 用 内 伐 视 





MySQL 和 PostgreSQL 
使 用 DISTINCT 计算 工资 总 额 。 


select 


17 group 


deptno, 
sum(distinct sal) as total sal, 
sum(bonus) as total bonus 


( 

e.empno, 

e.ename, 

e.sal, 

e.deptno, 

e.sal*case when eb.type - 1 then .1 
when eb.type = 2 then .2 


else .3 
end as bonus 
emp e, emp bonus eb 


e.empno = eb.empno 
e.deptno - 10 

)x 

by deptno 


pos Oracle 和 SQL Server 
述 解决 方案 也 适用 于 这 些 数据 库 。 另 外 ， 它 们 还 支持 窗口 国 数 SUM OVER, 





图 执行 聚合 运算 的 做 法 。 








1 select distinct deptno,total_sal,total_bonus 
2 from ( 
3 select e.empno, 
4 e.ename, 
5 sum(distinct e.sal) over 
6 (partition by e.deptno) as total sal, 
7 e.deptno, 
8 sum(e.sal*case when eb.type - 1 then .1 
9 when eb.type = 2 then .2 
10 else .3 end) over 
11 (partition by deptno) as total bonus 
12 from emp e, emp bonus eb 
13 where e.empno = eb.empno 
14 and e.deptno - 10 
15 )x 
3. 讨 论 
MySQL 和 PostgreSQL 
本 实例 “问题 ”部 分 的 第 二 个 查询 语句 把 EMP 表 和 EMP_BONUS 表 连 接 起 来 ， 并 返回 了 员工 
MILLER 的 两 行 数据 ， 这 是 导致 EMP 表 的 工资 总 额 出 错 的 原因 (MILLER 的 工资 被 加 了 两 


次 )。 对 应 的 解决 办 法 是 只 计算 不 同 的 EMP.SAL 值 。 下 面 的 查询 语句 是 另 一 种 解决 方案 。 首 
先 计算 部 门 编号 为 10 的 全 部 员工 的 工资 总 额 
































i， 然 后 连接 EMP 表 和 EMP_BONUS Æ. FI 





[的 查 


























询 语句 适用 于 所 有 的 关系 数据 库 管理 系统 。 


select d.deptno, 





d.total_sal, 
sum(e.sal*case when eb.type = 1 then 
when eb.type = 2 then 


.1 
.2 


else .3 end) as totaL_bonus 


from emp e， 
emp, bonus eb, 


( 


select deptno, sum(sal) as total sal 


from emp 


where deptno - 10 
group by deptno 


) d 


where e.deptno = d.deptno 


and e.empno = eb.empno 


group by d.deptno,d.total sal 


DEPTNO TOTAL SAL TOTAL BONUS 


DB2, Oracle 和 SQL Server 





EÉ 


[的 











人 


向 


另 一 种 解决 方案 利用 了 窗口 国 数 SUM OVER, 
行 至 第 14 行 ， 返 回 的 结果 集 如 下 。 











= 


select e.empno, 


e.ename, 
sum(distinct e.sal) over 


(partition by e.deptno) as total sal, 


e.deptno, 
sum(e.sal*case when eb.type - 1 then 
when eb.type = 2 then 
else .3 end) over 
(partition by deptno) as total bonus 
from emp e, emp bonus eb 


where e.empno = eb.empno 


EMPNO ENAME 


and e.deptno - 10 





下 面 的 查询 语句 来 自 该 解决 方案 的 第 3 














.1 
.2 


TOTAL_SAL DEPTNO TOTAL_BONUS 





7934 MILLER 8750 10 2135 

7934 MILLER 8750 10 2135 

7782 CLARK 8750 10 2135 

7839 KING 8750 10 2135 
口 国 数 SUM OVER 被 调用 了 两 次 ， 第 一 次 调用 针对 指定 的 分 区 或 者 分 组 计算 工资 总 额 。 在 
侈 中 ， 分 区 指 的 是 编号 为 10 的 部 门 ， 该 部 门 员工 的 工资 总 额 是 8750。 第 二 次 调用 SUM 





本 


OVER 针对 同一 个 分 区 计算 奖金 总 额 。 最 终 的 结果 集 





TOTAL_BONUS 组 合 的 重复 项 之 后 产生 的 。 








则 是 在 去 除了 TOTAL SAL, DEPTNO 以 及 
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3.10 ”组合 使 用 外 连接 查询 与 聚合 函数 


1. 问题 





本 布 的 问题 和 3.9 节 的 大 致 相同 ， 只 是 略微 修改 了 EMP BONUS 表 的 数据 ， — 


10 的 员工 中 只 有 部 分 人 获得 了 奖金 。 考 虑 如 下 所 示 的 EMP_BONUS 表 和 查询 语句 ， 





(表面 上 ) 计算 出 了 部 门 编号 为 10 的 员工 的 工资 总 额 和 奖金 总 额 。 


select * from emp_bonus 


EMPNO RECEIVED TYPE 
7934 17-MAR-2005 1 
7934 15-FEB-2005 2 


select deptno, 
sum(sal) as total_sal, 
sum(bonus) as total_bonus 
from ( 
select e.empno, 
e.ename, 
e.sal, 
e.deptno, 
e.sal*case when eb.type - 1 then .1 
when eb.type = 2 then .2 
else .3 end as bonus 
from emp e, emp bonus eb 


where e.empno = eb.empno 
and e.deptno - 10 
) 


group by deptno 


DEPTNO TOTAL SAL TOTAL BONUS 


奖金 总 额 的 结果 是 正确 的 ， 但 工资 总 额 却 不 是 部 门 编号 为 19 的 员工 的 工资 总 额 
查询 语句 解释 了 为 什么 工资 总 额 不 正确 。 


select e.empno, 

.ename， 

.sal, 

.deptno, 

.sal*case when eb.type - 1 then .1 
when eb.type = 2 then .2 

else .3 end as bonus 
from emp e, emp bonus eb 
where e.empno = eb.empno 





e 
e 
e 
e 


and e.deptno - 10 

EMPNO ENAME SAL DEPTNO BONUS 
7934 MILLER 1300 10 130 
7934 MILLER 1300 10 260 














查询 





上 述 查 询 没 有 计算 部 门 编号 为 10 的 全 部 员工 的 工资 总 额 ， 实 际 上 只 有 MILLER 的 工资 被 
计 入 总 和 ， 而 且 被 错误 地 计算 了 两 次 。 其 实 ， 你 最 终 想得到 如 下 所 示 的 结果 集 。 


DEPTNO TOTAL SAL TOTAL BONUS 


2. 解决 方案 

下 面 的 解决 方案 也 和 3.9 节 的 类 似 ， 不 同 之 处 在 于 要 外 连接 EMP_BONUS 表 ， 确 保 把 部 门 编 
号 为 10 的 全 部 员工 都 包括 进来 。 

DB2, MySQL, PostgreSQL 和 SQL Server 

外 连接 EMP_BONUS 表 ， 然 后 去 掉 部 门 编号 为 19 的 员工 的 重复 项 ， 再 计算 工资 总 和 。 





1 select deptno， 

2 sum(distinct sal) as total sal, 
3 sum(bonus) as total bonus 

4 from ( 

5 select 
6 

7 

8 


e.empno, 
e.ename, 
e.sal, 
e.deptno, 
9 e.sal*case when eb.type is null then 0 
10 when eb.type = 1 then .1 
11 when eb.type = 2 then .2 
12 else .3 end as bonus 
13 from emp e left outer join emp_bonus eb 
14 on (e.empno = eb.empno) 
15 where e.deptno = 10 
16 ) 


17 group by deptno 


也 可 以 使 用 窗口 函数 SUM OVER, 


1 select distinct deptno,total_sal,total_bonus 

2 from ( 

3 select e.empno, 

4 e.ename, 

5 sum(distinct e.sal) over 

6 (partition by e.deptno) as total_sal, 

7 e.deptno, 

8 sum(e.sal*case when eb.type is null then 0 
9 when eb.type = 1 then .1 
10 when eb.type = 2 then .2 
11 else .3 

12 end) over 

13 (partition by deptno) as total_bonus 

14 from emp e left outer join emp_bonus eb 

15 on (e.empno = eb.empno) 

16 where e.deptno = 10 

17 ) x 


Oracle 
对 于 Oracle 9; 数据 库 及 其 后 续 版 本 ， 上 述 解 决 方案 仍然 适用 。 除 此 之 外 ， 我 们 也 可 以 使 
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用 Oracle 专 有 的 外 连接 语法 。 对 于 Oracle 8; 数据 库 及 更 早 的 版 本 ， 








外 连接 。 

1 select deptno， 

2 sum(distinct sal) as total_sal, 

3 sum(bonus) as total_bonus 

4 from ( 

5 select e.empno, 

6 e.ename, 

7 e.sal, 

8 e.deptno, 

9 e.sal*case when eb.type is null then 0 
10 when eb.type = 1 then .1 
11 when eb.type = 2 then .2 
12 else .3 end as bonus 
13 from emp e, emp_bonus eb 
14 where e.empno = eb.empno (+) 

15 and e.deptno = 10 
16 ) 
17 group by deptno 





与 DB2 及 其 他 数据 库 类 似 ，Oracle 8; 数据 局 











名 里 出 现 的 外 连接 改 为 Oracle 专 有 的 语法 。 











3. 讨论 


本 实例 “问题 ”部 分 中 的 第 二 个 查询 语句 连接 了 EMP 表 和 EMP_BONUS 表 ， 却 只 返 
MILLER 的 两 行 数据 ， 这 是 导致 EMP 表 的 工资 总 额 计算 出 错 的 原 
员工 没有 奖金 ， 他 们 的 工资 没有 被 计 入 总 和 )。 


节 的 基础 上 稍微 有 了 变动 。 如 果 EMP_BONUS 表 中 的 TYPE 为 Null 值 ， 则 CASE 表达 式 会 返回 





9， 这样 就 不 会 对 总 和 产生 影响 。 





P 
连接 EMP 表 和 






































select d 
d 
s 


from 


select 
from 
where 
group 


where 























只 能 使 用 该 语法 实现 


也 支持 SUM OVER 语法 ， 但 必须 把 上 面 的 查询 语 





回 了 员工 











因 〈 部 门 编号 为 10 的 其 他 





解决 办 法 则 是 把 EMP 表 外 连接 到 EMP_BONUS 
表 ， 这 样 一 来 ， 那 些 没 有 奖金 的 员工 也 会 被 计算 进来 。 如 果 一 个 员工 没有 奖金 ， 那 么 EMP_ 
BONUS 表 中 的 TYPE 就 是 Null 值 。 注 意 到 这 一 点 非常 重要 ， 因 为 CASE 语句 部 分 已 经 在 3.9 











i 的 查询 语句 是 另 一 种 解决 方案 。 首 先 计算 部 门 编号 为 10 的 员工 的 工资 总 额 ， 然 后 再 


























EMP BONUS 表 (这 样 就 避免 了 使 用 外 连接 )。 下 面 的 查询 语句 适用 于 所 有 的 关 


居 库 管理 系统 。 


.deptno, 

.total sal, 

um(e.sal*case when eb.type 
when eb.type 
else .3 end) 


emp e, 
emp bonus eb, 

( 

deptno, sum(sal) as total sal 
emp 

deptno - 10 

by deptno 

)d 

e.deptno - d.deptno 


1 then 
2 then .2 
as total bonus 


4 





| ^x 


50 B3: 


and e.empno = eb.empno 
group by d.deptno,d.total sal 


DEPTNO TOTAL SAL TOTAL BONUS 


3.11 从 多 个 表 中 返回 缺失 值 

1. 问题 
你 想 从 多 个 表 中 返回 缺失 值 。 找 到 存在 于 DEPT 表 而 不 存在 于 EMP 表 的 数据 〈 即 没有 员工 的 
部 门 ) 需要 使 用 外 连接 。 考 虑 下 面 的 查询 语句 ， 该 查询 返回 了 DEPT 表 中 所 有 的 DEPTNO 和 
DNAME， 以 及 每 个 部 门 里 全 部 员工 的 名 字 (如 果 这 个 部 门 有 员工 的 话 )。 

select d.deptno,d.dname,e.ename 


from dept d left outer join emp e 
on (d.deptno=e.deptno) 




















DEPTNO DNAME ENAME 
20 RESEARCH SMITH 
30 SALES ALLEN 
30 SALES WARD 
20 RESEARCH JONES 
30 SALES MARTIN 
30 SALES BLAKE 
10 ACCOUNTING CLARK 
20 RESEARCH SCOTT 
10 ACCOUNTING KING 
30 SALES TURNER 
20 RESEARCH ADAMS 
30 SALES JAMES 
20 RESEARCH FORD 


10 ACCOUNTING MILLER 
40 OPERATIONS 


最 后 一 行 是 OPERATIONS 部 门 ， 这 个 部 门 虽然 没有 员工 ， 却 也 出 现在 了 查询 结果 中 ， 这 是 
因为 DEPT 表 外 连接 了 EMP 表 。 现 在 假设 有 一 个 员工 不 属于 任何 部 门 ， 你 将 如 何 返 回 以 上 
结果 集 ， 并 且 包 含 那个 不 属于 任何 部 门 的 员工 呢 ? 换 句 话说 ， 个 查询 语句 
里 既 外 连接 到 EMP 表 又 外 连接 到 DEPT 表 。 在 创建 了 新 的 员工 数据 之 后 ， 第 一 次 尝试 可 能 
如 下 所 示 。 

insert into emp (empno,ename,job,mgr,hiredate,sal,comm,deptno) 

select 1111,'YODA', 'JEDI' ,null,hiredate,sal,comm,null 


from emp 
where ename - 'KING' 





























select d.deptno,d.dname,e.ename 
from dept d right outer join emp e 
on (d.deptno-ze.deptno) 
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DEPTNO DNAME ENAME 
10 ACCOUNTING MILLER 
10 ACCOUNTING KING 
10 ACCOUNTING CLARK 


20 RESEARCH FORD 
20 RESEARCH ADAMS 
20 RESEARCH SCOTT 
20 RESEARCH JONES 
20 RESEARCH SMITH 
30 SALES JAMES 
30 SALES TURNER 
30 SALES BLAKE 
30 SALES MARTIN 
30 SALES WARD 
30 SALES ALLEN 
YODA 





以 上 外 连接 查询 包含 了 那个 新 的 员工 ， 却 丢失 了 先前 结果 集 里 的 OPERATIONS 部 门 。 最 终 的 
结果 集 应 该 既 包 括 YODA， 也 包括 OPERATIONS， 如 下 所 示 。 


DEPTNO DNAME ENAME 
10 ACCOUNTING CLARK 
10 ACCOUNTING KING 
10 ACCOUNTING MILLER 


20 RESEARCH ADAMS 
20 RESEARCH FORD 
20 RESEARCH JONES 
20 RESEARCH SCOTT 
20 RESEARCH SMITH 
30 SALES ALLEN 
30 SALES BLAKE 
30 SALES JAMES 
30 SALES MARTIN 
30 SALES TURNER 
30 SALES WARD 


40 OPERATIONS 
YODA 


2. 解决 方案 

使 用 全 外 连接 (full outer join) ， 基 于 一 个 共同 值 从 两 个 表 中 返回 缺失 值 。 
DB2. MySQL. PostgreSQL 和 SQL Server 

使 用 显 式 的 全 外 连接 命令 从 两 个 表 中 返回 缺失 的 行 以 及 相 匹配 的 行 。 


1 select d.deptno,d.dname,e.ename 
2 from dept d full outer join emp e 
3 on (d.deptno=e.deptno) 


或 者 ， 也 可 以 合并 两 个 外 连接 的 查询 结果 。 


1 select d.deptno,d.dname,e.ename 
2 from dept d right outer join emp e 


























3 on 

4 union 

5 select 

6 from 

7 on (d.deptn 
Oracle 


(d.deptnoze.deptno) 


d.deptno,d.dname,e.ename 
dept d left outer join emp e 


o-e.deptno) 


对 于 Oracle 9i 数据库 及 其 后 续 版 本 ， 上 述 解决 方案 仍然 适用 。 除 此 之 外 ， 我 们 也 可 以 使 用 
Oracle 专 有 的 外 连接 语法 。 对 于 Oracle 8; 数据 库 及 更 早 的 版 本 ， 只 能 使 用 专 有 语法 实现 外 


连接 。 


GA a L OO N P 


3. 讨论 


select 
where 
union 


select 


where 





d.deptno,d.dname,e.ename 
from dept d, 
d.deptno = e.deptno(*) 


emp e 


d.deptno,d.dname,e.ename 
from dept d, 
d.deptno(*) = e.deptno 


emp e 


全 外 连接 查询 其 实 就 是 合并 两 个 表 的 外 连接 查询 的 结果 集 。 为 了 理解 全 外 连接 背后 的 运行 
原理 ， 直 接 执 行 每 一 个 外 连接 查询 ， 然 后 合并 其 查询 结果 集 即 可 。 下 面 的 查询 找 出 了 DEPT 
表 里 与 EMP 表 相 匹配 的 所 有 行 (如 果 存 在 的 话 )。 









































select d.deptno,d.dname,e.ename 
from dept d left outer join emp e 

on (d.deptno = e.deptno) 

DEPTNO DNAME ENAME 
20 RESEARCH SMITH 
30 SALES ALLEN 
30 SALES WARD 
20 RESEARCH JONES 
30 SALES MARTIN 
30 SALES BLAKE 
10 ACCOUNTING CLARK 
20 RESEARCH SCOTT 
10 ACCOUNTING KING 
30 SALES TURNER 
20 RESEARCH ADAMS 
30 SALES JAMES 
20 RESEARCH FORD 
10 ACCOUNTING MILLER 
40 OPERATIONS 

接 下 来 的 这 个 查询 找 出 了 EMP 表 里 与 DEPT 表 相 匹配 的 所 有 行 (如 果 存 在 的 话 )。 


select d.deptno,d.dname,e.ename 
from dept d right outer join emp e 


on 


DEPTNO 


(d.deptno 


DNAME 


= e.deptno) 


ENAME 
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10 ACCOUNTING MILLER 
10 ACCOUNTING KING 
10 ACCOUNTING CLARK 




















20 RESEARCH FORD 

20 RESEARCH ADAMS 

20 RESEARCH SCOTT 

20 RESEARCH JONES 

20 RESEARCH SMITH 

30 SALES JAMES 

30 SALES TURNER 

30 SALES BLAKE 

30 SALES MARTIN 

30 SALES WARD 

30 SALES ALLEN 

YODA 
合并 上 面 的 两 个 查询 结果 ， 就 可 以 得 到 最 终 的 结果 集 。 
`= "- 

3.12 在 运算 和 比较 中 使 用 NuLL 
1. 问题 





Null 不 会 等 于 或 不 等 于 任何 值 ， 甚 至 不 能 与 其 自身 进行 比较 ， 但 是 你 希望 对 从 Null 列 返 
回 的 数据 进行 评估 ， 就 像 评估 具体 的 值 一 样 。 例 如 ， 你 想 找 出 EMP 表 里 业务 提成 (COMM 
列 ) 比 员工 WARD 低 的 所 有 员工 。 检 索 结 果 应 该 包含 业务 提成 为 Null 的 员工 。 

2. 解决 方案 

使 用 如 COALESCE 这 样 的 函数 把 Null 转换 为 一 个 具体 的 、 可 以 用 于 标准 评估 的 值 。 























1 select ename,comm 

2 from emp 

3 where coalesce(comm,0) « ( select comm 

4 from emp 

5 where ename - 'WARD' ) 


3. 讨论 

COALESCE 国 数 会 返回 参数 列表 里 的 第 一 个 非 Null 值 。 就 本 实例 而 言 ，COMM 列 中 的 Null 会 
被 替换 为 0， 这 样 才能 与 WARD 的 业务 提成 相 比 较 。 把 COALESCE 函数 添加 到 SELECT 列 
表 ， 就 能 查看 其 执行 结果 。 


select ename,comm, coalesce(comm, 0) 




















from emp 
where coalesce(comm,0) « ( select comm 
from emp 
where ename - 'WARD' ) 
ENAME COMM COALESCE( COMM, 0) 
SMITH 0 
ALLEN 300 300 





JONES 
BLAKE 
CLARK 
SCOTT 
KING 
TURNER 
ADAMS 
JAMES 
FORD 
MILLER 


邮 


SO 








第 4 章 


插入 、 更 新 和 删除 








前 儿童 主要 介绍 基本 的 查询 技巧 ， 重 点 讨论 如 何 从 数据 库 获 取 数据 。 本 章 将 讨论 下 面 的 三 
个 话题 。 


° 插入 新 记录 ; 

° 更 新 已 有 记录 ，; 

。 删除 不 需要 的 记录 。 

为 了 方便 读者 查阅 ， 本 章 的 实例 已 经 按照 话题 进行 分 组 。 首 先是 与 “插入 ”相关 的 实例 ， 
然后 是 与 “更 新 ”相关 的 实例 ， 最 后 是 与 “删除 ”相关 的 实例 。 

插入 记录 通常 简单 易 懂 。 它 可 以 解决 插入 一 行 数据 这 样 的 简单 问题 。 然 而 ， 在 大 多 数 情况 
下 ， 使 用 基于 集合 的 方法 来 创建 新 行 ， 效 率 更 高 。 为 实现 这 一 目标 ， 你 需要 了 解 如 何 一 次 
性 地 向 数据 库 插入 多 行 数 据 。 

同样 ， 更 新 和 删除 记录 也 很 简单 。 你 可 以 更 新 或 者 删除 一 条 记录 ， 也 可 以 直接 一 次 性 地 更 
新 整个 记录 集 。 有 许多 种 方便 的 方法 可 以 删除 记录 。 例 如 ， 你 可 以 根据 一 个 表 中 的 某 些 行 
是 否 存在 于 另 一 个 表 中 来 删除 这 些 行 。 

如 果 使 用 SQL 数据 库 ， 你 甚至 可 以 一 次 性 地 插入 、 更 新 和 删除 所 有 相关 记录 ， 这 是 SQL 
新 添加 的 标准 功能 。 它 现在 看 起 来 似乎 不 是 很 有 用 ， 不 过 MERGE 语句 的 功能 十 分 强大 ， 能 
够 将 一 个 数据 库 表 与 另 一 个 外 部 数据 源 同 步 。 例 如 ， 一 个 来 自 远程 系统 的 文本 流 。 请 参考 
本 章 的 相关 内 容 。 
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4.1 插入 新 记录 


1. 问题 

你 希望 向 某 个 表 中 插入 一 条 新 记录 。 例 如 ， 你 想 插入 一 条 新 记录 到 DEPT 表 里 。DEPTN0O 的 
值 应 该 为 506，DNAME 设 为 PROGRAMMING, mij LOC 则 是 BALTIMORE, 

2. 解决 方案 

使 用 INSERT 语句 和 VALUES 子 句 可 以 一 次 插入 一 行 。 


insert into dept (deptno,dname,loc) 
values (50,'PROGRAMMING', 'BALTIMORE') 


对 于 DB2 和 MySQL， 你 可 以 选择 一 次 插入 一 行 ， 或 者 通过 附加 多 个 VALUES 列表 来 一 次 性 
插入 多 行 记 录 。 
/* 多 行 插入 */ 
insert into dept (deptno,dname,loc) 
values (1,'A','B'), 
(2,'B','C') 








3. 讨论 
INSERT 语句 允许 你 在 数据 库 表 里 创建 新 的 行 。 不 论 使 用 哪 一 种 数据 库 ， 插 入 一 条 记录 的 语 
法 都 是 相同 的 。 

INSERT 还 有 一 种 简写 方式 ， 你 可 以 省 略 字段 列表 。 


insert into dept 
values (50,'PROGRAMMING', 'BALTIMORE') 


然而 ， 如 果 你 不 指明 目标 列 ， 则 必须 为 所 有 列 插入 数据 ， 还 要 注意 VALUES 列表 的 顺序 。 也 
就 是 说 ， 你 必须 严格 遵守 SELECT * 语句 输出 结果 里 各 列 的 显示 顺序 。 


4.2 ”插入 默认 值 


1. 问题 
可 以 定义 表 的 某 些 列 的 默认 值 。 你 想 在 插入 一 行 的 时 候 使 用 预 设 的 默认 值 ， 而 不 是 指定 的 
值 。 考 虑 下 面 的 表 。 

create table D (id integer default 0) 
你 希望 插入 0， 并 且 不 想 显 式 地 在 INSERT 语句 的 VALUES 列表 里 指定 0。 你 只 希望 显 式 地 插 
入 默认 值 ， 而 不 管 预 设 的 默认 值 是 什么 。 
2. 解决 方案 
所 有 数据 库 都 支持 使 用 DEFAULT 关键 字 来 显 式 地 为 某 一 列 指定 默认 值 ， 部 分 数据 库 还 提供 
了 其 他 方法 来 解决 这 一 问题 。 
DEFAULT 关键 字 的 使 用 示例 如 下 。 


insert into D values (default) 
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如 果 你 没有 为 所 有 列 都 插入 数值 ， 则 你 需要 直接 指定 列 名 。 


insert into D (id) values (default) 


Oracle 8; 数据 库 及 更 早 的 版 本 不 支持 DEFAULT 关键 字 。 因 此 ， 对 于 Oracle 9i 之 前 的 版 本 ， 
没有 办 法 为 某 一 列 显 式 地 插入 默认 值 。 


如 果 所 有 列 都 预 设 了 默认 值 ，MySQL 允许 指定 一 个 空白 的 VALUES 列表 。 
insert into D values () 

这 样 就 可 以 为 所 有 列 创 建 预 设 的 默认 值 。 

PostgreSQL 和 SQL Server 支持 DEFAULT VALUES 子 句 。 









































insert into D default values 
DEFAULT VALUES 子 句 会 使 得 所 有 字段 均 取 默认 值 。 
3. 讨论 
在 创建 表 的 过 程 中 ，DEFAULT 关键 字 会 按照 表 定义 中 指定 的 默认 值 为 特定 的 列 插入 一 个 值 。 
DEFAULT 关键 字 适 用 于 所 有 的 数据 库 管理 系统 。 
如 果 预 先 为 表 的 每 一 列 都 定义 了 默认 值 (比如 ， 本 实例 中 的 D 表 )， 则 MySQL, 
PostgreSQL 和 SQL Server 用 户 还 有 其 他 的 选择 。 为 了 创建 一 行 全 是 默认 值 的 记录 ， 你 可 
以 指定 一 个 空白 的 VALUES 列表 (适用 于 MySQL) ， 或 者 使 用 DEFAULT VALUES 子 句 (适用 于 
PostgreSQL 和 SQL Server)。 否 则 ， 你 就 需要 为 表 的 每 一 列 都 指定 DEFAULT 关键 字 。 
对 于 那些 既 有 默认 值 列 又 有 非 默 认 值 列 的 表 ， 只 要 不 把 预 设 了 默认 值 的 列 写 入 INSERT 列 
表 ， 就 能 方便 地 为 它们 插入 默认 值 。 也 就 是 说 ， 在 这 里 你 不 需要 使 用 DEFAULT 关键 字 。 假 
设 D 表 还 有 一 列 ， 而 该 列 没有 预 设 的 默认 值 。 

create table D (id integer default 0, foo varchar(10)) 
在 INSERT 列表 里 只 指定 F00 列 ， 就 可 以 为 ID 列 插入 默认 值 。 

insert into D (name) values ('Bar') 
上 述 语句 会 产生 一 行 ID 列 为 9 而 F00 列 为 Bar 的 数据 。ID 列 会 被 设 为 默认 值 ， 因 为 我 们 
没有 为 它 指定 其 他 的 值 。 


4.3 ANUE ZAMA 

1. 问题 

你 想 要 插入 一 列 ， 该 列 有 默认 值 ， 但 你 想 将 其 设置 为 Null 而 不 是 默认 值 。 考 虑 如 下 的 表 。 
create table D (id integer default 0, foo VARCHAR(10)) 

你 希望 为 ID 列 插入 Null, 


2. 解决 方案 
在 VALUES 列表 里 显 式 地 指定 Null, 
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insert into d (id, foo) values (null, 'Brighten') 


3. 讨论 
有 些 人 不 知道 INSERT 语句 的 VALUES 列表 可 以 显 式 指定 Null。 一 个 典型 的 例子 可 以 证 明 这 
一 点 ， 当 不 想 为 某 一 列 插入 特定 值 的 时 候 ， 有 些 人 会 把 该 列 从 VALUES 列表 里 去 掉 。 


insert into d (foo) values ('Brighten') 


在 这 里 ， 并 没有 指定 ID 列 的 值 。 许 多 人 可 能 以 为 ID 列 会 被 插入 Nutl， 但 是 因为 创建 表 的 
时 候 预 设 了 默认 值 ， 所 以 上 述 INSERT 语句 执行 后 ，ID 列 会 被 设置 为 0 (默认 值 )。 通 过 明 
确 指定 某 字段 为 NtL， 即 使 该 字段 有 预 设 的 默认 值 也 能 为 其 插入 Null, 


4.4 复制 数据 到 另 一 个 表 


1. 问题 

你 想 使 用 查询 语句 把 一 些 数据 从 一 个 表 复 制 到 另 一 个 表 里 去 。 该 查询 语句 可 能 很 复杂 ， 也 
可 能 很 简单 ， 但 你 希望 最 终 把 数据 插入 到 另 一 个 表 。 例 如 ， 你 希望 把 DEPT 表 的 部 分 数据 复 
制 到 DEPT EAST 表 。 假 设 DEPT EAST 表 已 经 被 创建 好 了 ， 其 结构 与 DEPT 表 相 同 (有 同样 的 
列 和 数据 类 型 ) ， 而 且 该 表 当 前 不 含 任何 数据 。 

2. 解决 方案 

在 INSERT 语句 后 面 附 加 一 个 用 来 检索 目标 数据 的 查询 语句 。 


1 insert into dept east (deptno,dname,loc) 
2 select deptno,dname,loc 









































3 from dept 
4 where loc in ( 'NEW YORK','BOSTON' ) 
3. 讨论 


只 需 在 INSERT 后 面 附 加 一 个 用 来 检索 目标 数据 的 查询 语句 就 可 以 解决 这 一 问题 。 如 果 你 希 
望 复制 表 里 的 全 部 数据 ， 那 就 要 去 掉 WHERE 子 句 。 类 似 于 正常 的 INSERT 语句 ， 你 也 不 必 明 
确 指定 要 插入 哪些 列 。 但 是 ， 如 果 你 选择 不 指明 目标 列 ， 你 就 必须 为 所 有 列 都 插入 数据 ， 
并 且 正 如 4.1 节 所 讨论 过 的 ， 你 也 必须 注意 SELECT 列表 里 各 列 的 顺序 。 


4.5 复制 表 定 义 


1. 问题 

你 想 创建 一 个 新 表 ， 该 表 和 当前 已 存在 的 表 保持 相同 的 结构 定义 。 例 如 ， 你 希望 为 DEPT 表 
创建 一 个 副本 ， 命 名 为 DEPT_2。 但 是 ， 你 只 想 复制 它 的 表 结构 ， 而 不 复制 数据 。 

2. 解决 方案 

DB2 

使 用 CREATE TABLE 语句 和 LIKE 子 句 。 


create table dept 2 like dept 
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Oracle. MySQL 和 PostgreSQL 
使 用 CREATE TABLE 语句 和 一 个 不 返回 任何 数据 的 子 查询 。 


1 create table dept_2 
2 as 

3 select * 

4 from dept 

5 where 1 = 0 





SQL Server 
使 用 SELECT 语句 和 INTO 子 句 ， 但 要 保证 该 查询 不 返回 任何 数据 。 
1 select * 
2 into dept 2 
3 from dept 
4 where 1 = 90 


3. 讨论 
DB2 
DB2 的 CREATE TABLE...LIKE 语句 能 以 现 有 的 表 为 模板 快速 创建 一 个 新 表 。 只 要 把 模板 表 的 
名 字 放 在 LIKE 关键 字 的 后 面 即 可 。 

Oracle、MySQL 和 PostgreSQL 

使 用 Create Table As Select ( 简写 为 CTAS) 语句 时 ， 除 非 为 WHERE 子 句 指定 一 个 不 可 能 为 
真 的 条 件 ， 否 则 ， 查 询 结 果 集 将 会 被 写 入 新 表 。 本 例 中 ，WHERE 子 句 后 面 的 表达 式 1=0 会 
导致 查 询 不 返回 任何 结果 。 因 此 ， 上 述 CTAS 语句 的 执行 结果 就 是 一 张 空 表 ， 该 表 的 列 取决 
于 SELECT 子 句 的 查询 结果 。 
SQL Server 

使 用 INTO 子 句 复制 表 定 义 时 ， 除 非 为 WHERE 子 句 指定 一 个 不 可 能 为 真 的 条 件 ， 否 则 的 话 查 
询 结 果 集 将 会 被 写 和 新 表 。 本 例 中 ，WHERE 子 句 后 面 的 表达 式 1-0 会 导致 查询 不 返回 任何 
结果 。 上 述 语 句 的 执行 结果 是 一 张 空 表 ， 该 表 的 列 取决 于 SELECT 子 句 的 查询 结果 。 
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1. 问题 

你 想 把 一 个 查询 语句 返回 的 结果 集 插入 到 多 个 目标 表 中 。 例 如 ， 你 希望 把 DEPT 表 的 数据 分 
别 插入 到 DEPT EAST 表 、DEPT_WEST 表 和 DEPT_MID 表 。 这 3 个 表 与 DEPT 表 的 结构 相同 ( 相 
同 的 列 和 数据 类 型 )， 并 且 当 前 不 含 任何 数据 。 

2. 解决 方案 

解决 办 法 就 是 把 查询 结果 插入 到 多 个 目标 表 中 。 与 4.4 节 的 不 同 之 处 在 于 ， 这 次 的 目标 表 
不 止 一 个 。 

Oracle 

使 用 INSERT ALL 或 者 INSERT FIRST 语句 。 除 ALL 和 FIRST 关键 字 不 同 之 外 ， 二 者 的 语法 并 
无 二 致 。 下 面 使 用 INSERT ALL 语句 ， 它 能 够 确保 兼顾 所 有 目标 表 。 
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insert all 


when loc in ('NEW YORK','BOSTON') then 
into dept east (deptno,dname,loc) values (deptno,dname,loc) 


when loc = 'CHICAGO' then 


else 


into dept west (deptno,dname,loc) values (deptno,dname,loc) 


select deptno,dname,loc 
from dept 


DB2 


ARES — AARE, rfi ACER 
需要 为 各 个 目标 表 添 加 一 个 约束 条 件 ， 确 保 每 一 行 数据 都 会 被 插入 到 正确 的 表 中 。 





create table dept east 
( deptno integer, 
dname varchar(10), 
loc varchar(10) check (loc 


create table dept mid 
( deptno integer, 
dname varchar(10), 
loc varchar(10) check (loc 


create table dept west 
( deptno integer, 
dname varchar(10), 
loc varchar(10) check (loc 


insert into ( 


in 


1 
2 
3 
4 
5 into dept mid (deptno,dname,loc) values (deptno,dname,loc) 
6 
7 
8 
9 











图 是 对 所 有 目标 表 执 行 UNION ALL 得 到 的 结果 。 你 











('NEW YORK' , 'BOSTON' ))) 


' CHICAGO )) 


'DALLAS' )) 


1 

2 select * from dept west union all 
3 select * from dept east union all 
4 
5 


select * from dept mid 
) select * from dept 


MySQL, PostgreSQL 和 SQL Server 








3. 讨论 
Oracle 


Oracle 的 多 表 插 入 使 用 WHEN- THEN-ELSE 子 句 逐 行 评估 般 套 SELECT 语句 所 返回 的 结果 ， 并 


在 写作 本 书 时 ， 这 些 数据 库 尚 不 支持 多 表 插 入 。 























将 数据 插入 到 相应 的 表 中 。 虽 然 就 本 实例 而 言 ，INSERT ALL 和 INSERT FIRST 产生 的 结果 相 
同 ， 但 它们 仍然 有 差别 。 一 旦 WHEN-THEN-ELSE 的 结果 为 真 ，INSERT FIRST 会 立即 结束 评估 ; 




















INSERT ALL 则 会 逐一 评估 所 有 和 条件， 而 不 论 前 面 的 测试 结果 是 否 真 。 因 此 ， 使 用 INSERT 





DB2 
前 面 的 DB2 解决 方案 有 点 不 太 正 统 ， 








ALL 有 可 能 把 同一 行 数据 插入 到 多 个 表 。 








大 











为 它 要 求 在 目标 表 的 定义 里 加 入 额外 的 约束 条 件 ， 





以 确保 查询 结果 的 每 一 行 都 能 被 复制 到 正确 的 目标 表 中 。 该 技巧 的 要 点 在 于 把 数据 插入 一 
个 针对 所 有 目标 表 执 行 UNION ALL 合并 后 得 到 的 视图 里 去 。 如 果 为 目标 表 添 加 的 检查 约束 
存在 二 义 性 (例如 ， 多 个 表 含 有 相同 的 检查 约束 )， 那 么 INSERT 语句 就 无 法 判断 要 把 数据 
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插入 到 哪个 表 ， 这 样 它 就 无 法 成 功 执行 。 
MySQL. PostgreSQL 和 SQL Server 


在 写作 本 书 时 ， 只 有 Oracle 和 DB2 可 以 使 用 一 个 语句 就 能 把 某 个 查询 的 结果 集 插入 到 多 
个 目标 表 。 


4.7 ” 茜 止 插入 特定 列 


1. 问题 

你 想 阻 止 用 户 或 者 错误 的 软件 应 用 程序 在 某 些 列 中 插入 数据 。 例 如 ， 你 希望 一 个 程序 插入 

数据 到 EMP 表 ， 但 只 人 允许 它 插 入 EMPNO、ENAME 和 JOB 列 。 

2. 解决 方案 

创建 一 个 视图 ， 只 暴露 那些 你 希望 暴露 的 列 。 然 后 强制 所 有 INSERT 语句 都 被 传送 到 该 

视图 。 

例如 ， 下 面 的 语句 创建 了 一 个 视图 ， 暴 露出 EMP 表 的 三 个 列 。 
create view new_emps as 


select empno, ename, job 
from emp 


为 那些 可 以 向 上 面 三 个 列 中 写 入 数据 的 用 户 和 程序 赋予 视图 的 插入 权限 。 不 要 把 EMP 表 的 
插入 权限 授权 给 用 户 。 这 样 用 户 插入 数据 到 NEW_EMPS 视图 后 就 可 以 创建 新 的 EMP 记录 ， 但 
是 他 们 不 能 为 视图 定义 里 不 存在 的 列 提供 插入 值 。 
3. 讨论 

向 一 个 简单 视图 插入 数据 ， 数 据 库 服 务 器 会 把 它 转换 为 针对 基础 表 的 插入 操作 。 例 如 ， 下 
fly INSERT 语句 。 

















































































































insert into new_emps 
(empno ename, job) 
values (1, 'Jonathan', 'Editor') 


会 被 翻译 成 


insert into emp 
(empno ename, job) 
values (1, 'Jonathan', 'Editor') 


也 可 以 插入 数据 到 内 徐 视 图 (目前 只 有 Oracle 支持 ) ， 但 这 种 做 法 可 能 不 是 很 有 用 。 


insert into 
(select empno, ename, job 
from emp) 
values (1, 'Jonathan', 'Editor') 


视图 插入 很 复杂 。 如 果 不 是 针对 最 简单 的 视图 做 插入 操作 ， 那 么 问题 会 立刻 变 得 超级 复 
杂 。 如 果 想 使 用 视图 插入 功能 ， 那 么 就 要 仔细 研读 和 全 面 理解 相应 的 数据 库 关 于 此 功能 的 
帮助 文档 。 








WRI 
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48 更 新 记录 


1. 问题 
你 想 更 新 一 个 表 的 部 分 记录 或 者 全 部 记录 。 例 如 ， 你 可 能 希望 为 部 门 编号 为 20 的 员工 统 
一 加 薪 10%。 下 面 的 结果 集 显示 了 那个 部 门 全 部 员工 的 DEPTNO, ENAME 和 SAL, 


























select deptno,ename,sal 
from emp 

where deptno = 20 
order by 1,3 




















DEPTNO ENAME SAL 

20 SMITH 800 

20 ADAMS 1100 

20 JONES 2975 

20 SCOTT 3000 

20 FORD 3000 

你 希望 把 所 有 SAL 值 都 提高 10%. 
2. 解决 方案 


使 用 UPDATE 语句 更 新 已 有 数据 。 例 如 : 


1 update emp 
2 set sal = sal*1.10 
3 where deptno = 20 


3. 讨论 
使 用 UPDATE 语句 和 WHERE 子 句 来 指定 哪些 行将 被 更 新 。 如 果 省 略 WHERE 子 句 ， 那 么 全 部 行 
都 会 被 更 新 。 上 述 解决 方案 里 的 表达 式 SAL*1.10 返回 增加 10% 后 的 工资 。 


在 大 规模 数据 更 新 之 前 ， 你 可 能 希望 先 预览 结果 。 可 以 通过 提交 一 个 SELECT 语句 ， 并 把 计 
划 放 入 SET 子 名 的 表达 式 包含 进 SELECT 语句 来 实现 预览 。 下 面 的 SELECT 语句 显示 了 工资 
增加 10% 后 的 结果 。 


select deptno, 

ename, 
sal as orig sal, 
sal*.10 as amt to add, 
sal*1.10 as new sal 

from emp 

where deptno-20 

order by 1,5 


















































DEPTNO ENAME ORIG SAL AMT TO ADD NEW SAL 


20 SMITH 800 80 880 
20 ADAMS 1100 110 1210 
20 JONES 2975 298 3273 
20 SCOTT 3000 300 3300 
20 FORD 3000 300 3300 


工资 的 增加 被 分 为 两 列 : 一 列 显示 实际 增加 值 ， 另 一 列 显 示 增 加 后 的 工资 。 
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49 当 相 关 行 存在 时 更 新 记录 


1. 问题 

你 想 更 新 一 个 表 的 部 分 行 ， 而 更 新 条 件 取 决 于 另 一 个 表 中 是 否 有 与 之 相关 的 行 。 例 如 ， 如 
果 一 个 员工 出 现在 EMP_BONUS 表 中 ， 你 希望 把 他 的 工资 (在 EMP 表 中 ) 上 涨 20%。 下 面 的 
结果 集 显 示 了 EMP_BONUS 表 当 前 的 数据 。 


select empno，ename 
from emp_bonus 

















EMPNO ENAME 


7369 SMITH 
7900 JAMES 
7934 MILLER 


2. 解决 方案 
在 UPDATE 语句 的 WHERE 子 句 里 使 用 一 个 子 查询 来 检索 同时 存在 于 EMP 表 和 EMP_BONUS 表 的 
员工 。 这 样 UPDATE 语句 就 能 只 检索 那些 员工 的 记录 ， 并 为 其 增加 20% 的 工资 。 

1 update emp 


2 set sal-sal*1.20 
3 where empno in ( select empno from emp bonus ) 


3. 讨 论 
上 述 子 查询 的 结果 集 代 表 了 EM 表 中 将 要 被 更 新 的 行 。IN 谓词 用 于 评估 EMP 表 中 的 EMPNO 
列 是 否 存在 于 上 述 子 查询 返回 的 EMPNO 列表 里 。 如 果 是 的 话 ， 相 应 的 SAL 值 就 会 被 更 新 。 


除了 IN 谓词， 也 可 以 使 用 EXISTS, 


update emp 
set sal = sal*1.20 
where exists ( select null 
from emp_bonus 
where emp.empno=emp_bonus.empno ) 


你 可 能 会 惊讶 于 EXISTS 子 查询 的 SELECT 列表 只 有 一 个 NuLL。 不 必 担 心 ， 那 个 Null 对 更 新 
操作 没有 负面 影响 。 我 认为 这 样 做 反而 提高 了 查询 语句 的 可 读 性 ， 因 为 它 强调 了 这 样 一 个 
事实 : 真正 决定 更 新 操作 的 【( 例 如， 哪些 行 会 被 更 新 ) 是 子 查询 里 的 WHERE 子 句 ， 而 不 是 
SELECT 列表 。 这 与 本 解决 方案 里 使 用 的 IN 谓词 和 子 查询 不 同 。 


4.10 使 用 另 一 个 表 的 数据 更 新 记录 


1. 问题 
你 想 使 用 另 一 个 表 的 值 来 更 新 当前 的 表 。 例 如 ， 现 在 有 一 个 NEW SAL 表 ， 存 储 了 部 分 员工 
调整 后 的 工资 。NEW_SAL 表 的 数据 如 下 。 


select * 
from new_sal 
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DEPTNO SAL 





DEPTNO 列 是 NEW SAL 表 的 主键 。 你 希望 使 用 NEW. SAL 表 的 数据 来 更 新 EMP 表 中 部 分 员工 的 
工资 和 业务 提成 。 如 果 EMP 表 中 的 DEPTNO 列 和 NEW SAL 表 中 的 DEPTN0 列 相 匹配 ， 则 将 EMP 
表 中 的 SAL 列 更 新 为 NEW_SAL 表 中 的 SAL 列 ，EMP 表 中 的 COMM 列 更 新 为 NEW_SAL 表 中 SAL 
列 的 50%, EMP 表 的 全 部 数据 如 下 所 示 。 


select deptno,ename,sal,comm 








from emp 
order by 1 
DEPTNO ENAME SAL COMM 
10 CLARK 2450 
10 KING 5000 
10 MILLER 1300 
20 SMITH 800 
20 ADAMS 1100 
20 FORD 3000 
20 SCOTT 3000 
20 JONES 2975 
30 ALLEN 1600 300 
30 BLAKE 2850 
30 MARTIN 1250 1400 
30 JAMES 950 
30 TURNER 1500 0 
30 WARD 1250 500 
2. 解决 方案 





把 NEW. SAL 表 和 EMP 表 连 接 起 来 ， 为 UPDATE 语句 找 出 新 的 COMM 值 。 正 如 本 实例 所 示 ， 在 
UPDATE 语句 里 使 用 关联 子 查询 是 常用 做 法 。 另 一 种 方法 是 创建 一 个 视图 (传统 视图 或 者 内 
租 视 图 均 可 ， 这 取决 于 数据 库 是 否 支 持 )， 然 后 更 新 该 视图 即 可 。 

DB2 fe MySQL 

使 用 关联 查询 来 更 新 EMP 表 的 SAL 列 和 com 列 ， 同 时 也 要 使 用 另 一 个 关联 子 查 询 来 决定 
EMP 表 里 有 哪些 行 应 该 被 更 新 。 



































update emp e set (e.sal,e.comm) = (select ns.sal, ns.sal/2 
from new_sal ns 
where ns.deptno=e.deptno) 


from new_sal ns 


1 
2 
3 
4 where exists ( select null 
5 
6 where ns.deptno = e.deptno ) 


Oracle 
DB2 的 解决 方案 当然 也 适用 于 Oracle, Ab RIAD, BERARI. 


1 update ( 
2 select e.sal as emp sal, e.comm as emp comm, 
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3 ns.sal as ns_sal, ns.sal/2 as ns_comm 
4 from emp e, new_sal ns 

5 where e.deptno = ns.deptno 

6 ) set emp_sal = ns_sal, emp_comm = ns_comm 


PostgreSQL 


DB2 的 解决 方案 同样 适用 于 PostgreSQL， 也 可 以 在 UPDATE 语句 里 直接 进行 连接 查询 (dE 
常 方便 )。 





1 update emp 

2 set sal = ns.sal, 

3 comm = ns.sal/2 

4 from new sal ns 

5 where ns.deptno - emp.deptno 


SQL Server 
DB2 的 解决 方案 同样 适用 于 SQL Server， 也 可 以 在 UPDATE 语句 里 直接 进行 连接 查询 (类 
似 于 PostgreSQL 解决 方案 )。 








1 update e 

2 set e.sal = ns.sal, 

3 e.comm = ns.sal/2 

4 from emp e, 

5 new_sal ns 

6 where ns.deptno = e.deptno 


3. 讨论 

在 讨论 各 种 解决 方案 之 前 ， 我 想 先 说 一 下 在 UPDATE 语句 里 使 用 SELECT 查询 提供 新 值 的 
问题 。 在 UPDATE 语句 的 关联 子 查询 里 使 用 WHERE 子 句 不 同 于 针对 需要 更 新 的 表 所 使 用 的 
WHERE 子 句 。 如 果 你 看 一 下 “解决 方案 ”部 分 的 UPDATE 语句 就 会 明白 ，EMP 表 和 NEW. SAL 
表 基 于 pEPTNO 列 连 接 之 后 ， 把 查询 结果 传递 给 了 UPDATE 语句 的 SET 子 句 。 对 于 部 门 编号 
为 10 的 员工 而 言 ， 会 将 对 应 的 有 效 值 传递 给 SET 子 句 ， 因 为 在 NEW_SAL 表 里 有 与 之 相 匹 配 
的 DEPTN0。 但 是 对 其 他 部 门 的 员工 而 言 ， 又 当 如 何 呢 ? NEW SAL 表 里 没 有 其 他 部 门 的 数据 ， 
因此 对 于 部 门 编号 为 20 和 30 的 员工 来 说 ，SAL 列 和 CoMM 列 会 变 为 NutL。 除 非 使 用 LIMIT, 
TOP 或 者 其 他 由 数据 库 提供 的 限制 结果 集 行 数 的 机 制 ， 否 则 在 SQL 数据 库 里 唯一 能 限制 行 
数 的 办 法 就 是 使 用 WHERE 子 句 。 因 此 ， 为 了 正确 地 执行 UPDATE， 有 时 候 要 针对 需要 更 新 的 
表 使 用 WHERE 子 句 ， 有 时 候 却 要 在 关联 子 查询 里 使 用 WHERE 子 句 。 


DB2 和 MySQL 

为 了 确保 不 会 误 改 EM 表 的 全 部 行 ， 要 记得 在 UPDATE 语句 的 WHERE 子 句 里 使 用 关联 子 查 
询 。 因 为 仅仅 在 SET 子 句 里 执行 连接 查询 (关联 子 查询 ) 是 不 够 的 。UPDATE 语句 的 WHERE 
子 句 能 够 确保 只 更 新 EMP 表 中 那些 与 NEW_SAL 表 的 DEPTNO 列 相 匹 配 的 行 。 这 适用 于 所 有 的 
关系 数据 库 管理 系统 。 


Oracle 

Oracle 解决 方案 使 用 了 可 更 新 的 连接 视图 , 由 相等 连接 查询 来 决定 哪些 行将 被 更 新 。 我 们 
可 以 单独 执行 该 查询 语句 来 确认 哪些 行 会 被 更 新 ， 也 可 以 单独 执行 该 内 艇 视图 的 查询 语句 
来 确认 哪些 行将 被 更 新 。 若 想 正确 地 使 用 这 种 类 型 的 UPDATE， 你 必须 先 理解 “ 键 值 保 














































































































TR" (key-preservation), DEPTNO 列 是 NEW. SAL 表 的 主键 ， 所 以 它 的 值 是 唯一 的 。 当 EM X 
和 NEW. SAL 表 做 连接 查询 时 ，NEW_SAL 表 的 DEPTNO 列 在 结果 集 里 却 不 是 唯一 的 ， 如 下 所 示 。 
select e.empno, e.deptno e dept, ns.sal, ns.deptno ns, deptno 


from emp e, new sal ns 
where e.deptno = ns.deptno 











EMPNO E DEPT SAL NS DEPTNO 
7782 10 4000 10 
7839 10 4000 10 
7934 10 4000 10 





为 了 让 Oracle 能 够 通过 上 述 连 接 查 询 更 新 基础 表 ， 其 中 一 个 基础 表 必 须 符合 键 值 保持 的 要 
求 。 也 就 是 说 ， 如 果 它 的 值 在 连接 查询 的 结果 集 里 不 是 唯一 的 ， 那 么 至 少 在 基础 表 里 是 唯 
一 的 。 在 本 例 中 ，NEW_SAL 表 的 主键 是 DEPTNO 列 ， 因 而 符合 唯一 性 的 要 求 。 既 然 DEPTNO 列 
在 基础 表 里 是 唯一 的 ， 那 么 它 就 可 以 多 次 出 现在 连接 查询 的 结果 集 里 ， 并 被 判定 为 符合 键 
值 保 持 的 要 求 ， 更 新 操作 也 因此 得 以 成 功 执行 。 

PostgreSQL 和 SQL Server 

对 于 这 两 个 数据 库 而 言 ， 语 法 略 有 不 同 ， 但 方法 是 一 样 的 。 支 持 在 UPDATE 语句 里 直接 进行 
连接 查询 自 是 方便 之 极 。 由 于 指明 了 要 更 新 哪个 表 (通过 在 UPDATE 关键 字 之 后 给 出 表 的 名 
字 )， 数 据 库 系 统 也 就 会 知道 要 修改 哪个 表 。 除 此 之 外 ， 由 于 在 更 新 操作 里 使 用 了 连接 查 
询 (因为 显 式 地 使 用 了 WHERE 子 句 )， 我 们 得 以 避免 一 些 关 联 子 查询 的 陷阱 。 尤 其 是 如 果 不 
小 心 漏 掉 了 此 处 的 连接 查询 ， 那 么 就 能 很 容易 发 现 问题 。 


4.11 合并 记录 


1. 问题 

你 想 根据 相关 记录 是 否 已 经 存在 来 插入 、 更 新 或 删除 一 个 表 的 记录 。( 如 果 记 录 存 在 ， 则 
更 新 它 ， 如 果 不 存在 ， 则 插入 一 条 新 记录 ， 如 果 更 新 之 后 的 记录 不 满足 某 个 条 件 ， 则 删除 
它 。) 例如 ， 你 希望 按照 如 下 的 条 件 来 修改 EMP_COMMISSION 表 。 


° 如 果 EMP_COMMISSION 表 的 员工 数据 在 EMP 表 里 也 存在 相关 记录 , 则 更 新 其 业务 提成 (COMM) 
为 1000。 

° 对 于 所 有 可 能 会 把 com 列 更 新 为 1000 的 员工 ， 如 果 他 们 的 SAL 低 于 2000， 则 删除 相关 
记录 (他 们 不 应 该 存在 于 EMP_ COMMISSION R), 

。 否则 ， 就 要 从 EM 表 取 出 相应 的 EMPNO, ENAME 和 DEPTNO， 并 插入 EMP COMMISSION X, 


总 之 ， 你 希望 根据 EM 表 的 给 定 行 是 否 与 EMP_COMMISSION 表 里 的 某 条 记录 相 匹 配 来 决定 要 
执行 UPDATE 语句 还 是 INSERT 语句 。 然 后 ， 如 果 UPDATE 的 结果 导致 某 个 员工 的 业务 提成 大 
高 的 话 ， 你 希望 执行 DELETE 语句 。 

下 面 分 别 列 出 了 当前 EMP 表 和 EMP COMMISSION 表 里 的 数据 。 


select deptno,empno,ename,comm 
from emp 
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order by 1 


DEPTNO EMPNO ENAME COMM 
10 7782 CLARK 
10 7839 KING 
10 7934 MILLER 
20 7369 SMITH 
20 7876 ADAMS 
20 7902 FORD 
20 7788 SCOTT 
20 7566 JONES 
30 7499 ALLEN 300 
30 7698 BLAKE 
30 7654 MARTIN 1400 
30 7900 JAMES 
30 7844 TURNER 0 
30 7521 WARD 500 


select deptno,empno,ename,comm 
from emp commission 


order by 1 
DEPTNO EMPNO ENAME COMM 
10 7782 CLARK 
10 7839 KING 
10 7934 MILLER 
2. 解决 方案 





Oracle 是 目前 仅 有 的 只 使 用 单个 SQL 语句 就 能 解决 本 问题 的 关系 数据 库 管理 系统 。 这 就 是 
MERGE 语句 ， 在 实际 执行 时 ， 它 会 根据 需要 自动 转换 成 相应 的 UPDATE 语句 或 者 INSERT 语 














句 ， 如 下 所 示 。 


1 merge into emp commission ec 

2 using (select * from emp) emp 

3 on (ec.empno-emp.empno) 

4 when matched then 

5 update set ec.comm - 1000 

6 delete where (sal « 2000) 

7 when not matched then 

8 insert (ec.empno,ec.ename,ec.deptno,ec.comm) 

9 values (emp.empno,emp.ename,emp.deptno,emp.comm) 


3. 讨论 








在 上 述 的 解决 方案 里 ， 第 3 行 的 连接 条 件 决 定 了 哪些 行 已 经 存在 ， 因 而 需要 对 它们 执行 
新 操作 。 该 连接 查询 是 在 EMP COMMISSION 表 (别名 为 EC) 和 子 查询 (别名 为 emp) 之 间 
进行 的 。 若 连接 操作 成 功 ， 则 相关 的 两 行 被 认为 是 相 匹配 的 ， 进 而 WHEN MATCHED 子 句 里 的 








UPDATE 语句 会 被 执行 。 同 样 ， 如 果 根 据 EMPNO 7l], EMP 表 中 的 行 在 EMP_COMMISSION H 








Bü 


有 相 匹 配 的 行 ， 则 它 会 被 插入 到 EMP COMMISSION 表 中 。 在 EMP 表 里 ， 只 有 DEPTNO 等 于 10 
的 员工 ， 其 EMP_COMMISSION 表 的 coMM 才 会 被 更 新 ， 而 其 他 员工 的 数据 都 会 被 插入 到 EMP_ 























COMMISSION 表 。 另 外 ， 员 工 MILLER 的 DEPTNO 等 于 10， 本 来 他 的 业务 提成 (comm) 应 该 
被 更 新 ， 但 是 由 于 他 的 工资 (SAL) 低 于 2000， 因 而 他 会 被 从 EMP_COMMISSION 表 删 除 掉 。 


4.12 删除 全 表 记 录 





























1. 问题 

你 想 删 除 某 个 表 中 的 所 有 记录 。 

2. 解决 方案 

使 用 DELETE 语句 删除 记录 。 例 如 ， 下 述 语 句 将 把 EMP 表 中 的 全 部 记录 都 删除 掉 。 

















delete from emp 


3. 讨论 
如 果 DELETE 语句 后 面 没 有 WHERE 子 句 ， 则 会 删除 指定 表 的 全 部 记录 。 


4.13 删除 指定 记录 


1. 问题 

你 想 从 一 个 表 中 删除 满足 特定 条 件 的 记录 。 

2. 解决 方案 

使 用 DELETE 语句 和 WHERE 子 句 ， 其 中 WHERE 子 句 用 于 指定 要 删除 的 行 。 例 如 ， 下 面 的 语句 
将 删除 部 门 编 号 为 10 的 全 部 员工 数据 。 


delete from emp where deptno = 10 











3. 讨论 
使 用 DELETE 语句 里 的 WHERE 子 句 可 以 删除 一 个 表 的 部 分 数据 ， 而 不 是 全 部 数据 。 


4.14 删除 单行 记录 


1. 问题 

你 想 删 除 表 中 的 一 行 记 录 。 

2. 解决 方案 

这 是 4.13 节 的 特例 。 关 键 在 于 要 保证 你 的 检索 条 件 能 严 苛 到 只 
录 。 通 常 你 需要 按照 主键 删除 记录 。 例 如 ， 如 下 语句 将 删除 
7782) 的 数据 。 


delete from emp where empno = 7782 
3. 讨论 
删除 数据 的 关键 在 于 如 何 识别 哪些 行 要 被 删除 ，DELETE 语句 的 影响 力也 取决 于 其 WHERE F 
名 。 如 果 省 略 WHERE 子 句 ， 则 DELETE 语句 的 影响 范围 会 扩大 至 全 表 。 通 过 在 WHERE FAE 
































返回 需要 被 删除 的 那 条 记 
员工 CLARK CEMPNO 等 于 
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注 明 条 件 ， 我 们 能 缩小 范围 到 一 组 记录 ， 甚 至 单行 记录 。 如 果 要 删除 单行 记录 ， 通 常 你 应 
该 基于 主键 或 者 唯一 键 来 识别 要 删除 的 记录 。 

















因为 关系 数据 管理 系统 不 允许 两 行 数据 含 有 相同 的 主键 或 者 唯一 键 。) 否则 
的 话 ， 就 要 先 确 保 不 会 误 删 那些 原本 不 该 被 删除 的 记录 。 


4.15 删除 违反 参照 完整 性 的 记录 


1. 问题 
你 想 从 表 里 删除 一 些 记 录 ， 因 为 在 另 一 个 表 里 不 存在 与 这 些 记录 相 匹 配 的 数据 。 例 如 ， 一 
些 员工 所 属 的 部 门 其 实 并 不 存在 ， 你 希望 删除 这 些 员工 。 
2. 解决 方案 
使 用 NOT EXISTS 谓词 和 子 查询 来 确认 部 门 编号 的 有 效 性 。 
delete from emp 
where not exists ( 


select * from dept 
where dept.deptno = emp.deptno 








如 果 删 除 条 件 基 于 主键 或 者 唯一 键 ， 那 么 就 能 保证 仅 删除 一 条 记录 。( 这 是 











) 
或 者 ， 也 可 以 使 用 NOT IN 谓词 。 


delete from emp 
where deptno not in (select deptno from dept) 


3. 讨论 

删除 甚 实 就 是 查询 ， 最 重要 的 步骤 是 要 写 出 正确 的 WHERE 子 句 条件 ， 以 找 出 要 删除 哪些 记录 。 
EIR NOT EXISTS 解决 方案 使 用 关联 子 查询 来 检查 给 定 的 EMP 记录 是 否 存在 一 条 与 其 DEPTN0 
列 相 匹配 的 DEPT 记录 。 如 果 存 在 这 样 的 记录 ， 那 么 该 EMP 记录 就 应 该 被 保留 下 来 。 否 则 ， 
它 就 会 被 删除 。 每 一 条 EMP 记录 都 会 被 这 样 检查 一 次 。 

ER IN 解决 方案 使 用 子 查询 来 获取 有 效 部 门 编号 的 列表 。 然 后 针对 每 一 条 EMP 记录 ， 都 会 
与 该 列表 做 比照 检查 。 如 果 一 条 EM 记录 的 DEPTNO 不 存在 于 该 列表 中 ， 则 该 EMP 记录 会 被 
删除 。 


4.16 删除 重复 记录 


1. 问题 
你 想 删除 一 个 表 里 的 重复 记录 ， 考 虑 如 下 的 表 。 


create table dupes (id integer, name varchar(10)) 













































































insert into dupes values (1, 'NAPOLEON') 
insert into dupes values (2, 'DYNAMITE') 
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insert into dupes values (3, 'DYNAMITE') 

insert into dupes values (4, 'SHE SELLS') 
insert into dupes values (5, 'SEA SHELLS') 
insert into dupes values (6, 'SEA SHELLS') 
insert into dupes values (7, 'SEA SHELLS') 


select * from dupes order by 1 


1 NAPOLEON 

2 DYNAMITE 

3 DYNAMITE 

4 SHE SELLS 
5 SEA SHELLS 
6 SEA SHELLS 
7 SEA SHELLS 








对 于 每 一 组 重复 的 名 字 ， 例 如 SEA SHELLS， 你 希望 保留 js 意 一 个 ID， 并 删除 其 余 的 。 不 论 
删除 5 和 6， 或 者 5 和 7， 或 者 6 和 7， 最 终 你 只 想 要 一 条 SEASHELLS 记录 。 


2. 解决 方案 


使 用 子 查询 和 诸如 MIN 这样 的 聚合 函数 ， 任 意 选择 并 保留 一 个 ID (本 例 中 NAME 相同 的 情 
况 下 只 有 最 小 的 ID 会 被 保留 )。 





1 delete from dupes 

2 where id not in ( select min(id) 

3 from dupes 

4 group by name ) 


3. 讨论 

如 果 要 删除 重复 记录 ， 首 先 要 明确 两 行 数据 在 什么 条 件 下 才 会 被 认为 是 “重复 的 记录 ”。 
就 本 实例 而 言 ,，“ 重 复 的 记录 ”是 指 它 们 的 NAME 列 含有 相同 的 值 。 确 立 了 这 样 的 定义 之 后 ， 
还 要 看 一 下 能 区 分 重复 行 的 其 他 列 ， 以 便 决 定 要 保留 的 记录 。 最 理想 的 状况 是 能 区 分 重复 
行 的 那个 列 (或 者 那儿 列 ) 是 主键 。 在 这 里 我 选择 了 ID 列 ， 因 为 任意 两 条 记录 都 不 会 有 
重复 的 ID。 


这 个 解决 方案 的 关键 之 处 在 于 按照 重复 值 (本 例 中 是 NAME) 分 组 ， 并 使 用 聚合 函数 找 出 
一 个 将 要 保留 的 值 。 对 于 本 解决 方案 而 言 ， 子 查询 会 返回 最 小 的 ID， 其 代表 了 不 会 被 删 
除 的 行 。 

select min(id) 


from dupes 
group by name 






























































MIN(ID) 
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然后 ，DELETE 语句 会 删除 上 述 子 查询 返回 
好 地 型 


7)。 为 了 能 








select name, min(id) 
from dupes 
group by name 


DYNAMITE 
NAPOLEON 
SEA SHELLS 
SHE SELLS 


上 述 子 查询 返 


他 行 。 





4.17 删除 被 其 他 表 参 照 的 记录 


1. 问题 


如 果 表 里 的 一 
ACCIDENTS X, 


出 


些 记录 会 


值 之 外 的 所 有 10 (本 例 中 会 删除 的 ID 是 3、6 和 
E 解 上 述 子 查询 是 如 何 运 行 的 ， 不 妨 在 SELECT 列表 里 再 加 上 NAME 列 。 


回 的 结果 集 就 是 将 要 被 保留 的 行 。DELETE 语句 里 的 NOT IN 谓词 会 删除 其 


WO Re c PRA, 你 想 删除 它们 。 芳 虑 如 下 所 示 的 DEPT. 





部 门 以 及 事故 的 类 型 。 


create table dept accidents 
( deptno 
accident name varchar(20) ) 





insert 
insert 
insert 
insert 
insert 
insert 


select 


into 
into 
into 
into 
into 
into 


* fr 


DEPTNO 


integer, 


dept accidents values (10,'BROKEN FOOT') 
dept accidents values (10,'FLESH WOUND') 
dept accidents values (20,'FIRE') 

dept accidents values (20,'FIRE') 

dept accidents values (20,'FLOOD') 

dept accidents values (30,'BRUISED GLUTE') 


om dept accidents 
ACCIDENT NAME 


BROKEN FOOT 
FLESH WOUND 
FIRE 

FIRE 

FLOOD 

BRUISED GLUTE 





该 表 的 每 一 行 数据 代表 一 起 制造 业 生产 事故 。 每 一 行 都 记录 了 发 生 事 故 的 





对 于 发 生 了 3 件 以 上 事故 的 部 门 ， 你 希望 从 EMP 表 里 删除 掉 这 些 部 门 的 全 部 员工 记录 。 


2. 解 决 方案 


使 用 子 查询 和 聚合 国 数 COUNT 找 出 发 生 过 3 次 以 上 事故 的 部 门 ， 然 后 再 删除 在 上 


作 的 员工 。 








述 部 门 工 





1 delete from emp 
2 where deptno in ( select deptno 


3 from dept accidents 
4 group by deptno 
5 having count(*) >= 3 ) 


3. 讨论 
下 面 的 子 查询 用 于 识别 哪些 部 门 发 生 过 3 XA E3 
select deptno 
from dept_accidents 


group by deptno 
having count(*) >= 3 








X8] 
= 
$ 











DEPTNO 


DELETE 语句 会 删除 上 述 子 查询 返回 的 那些 部 门 的 全 部 员工 〈 本 例 中 只 是 部 门 编号 等 于 20 
的 部 门 ) 。 


Isl 
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在 本 章 的 实例 中 ， 你 可 以 查找 关于 给 定 模式 (schema) 的 信息 。 例 如 ， 你 可 能 想 知道 自己 
创建 了 哪些 表 ， 或 者 哪些 外 键 没有 添加 索引 。 本 书 中 的 所 有 关系 数据 库 管理 系统 都 提供 用 





c— 











于 获取 这 些 数据 的 表 和 视图 。 本 章 的 实例 将 指导 你 从 这 些 表 和 视图 中 获取 信息 。 然 而 ， 这 
些 实例 没有 讲解 完 所 有 的 内 容 ， 请 参考 相关 数据 库 的 帮助 文档 ， 获 取 目 录 或 数据 字典 视图 
( 表 ) 的 完整 信息 。 


oa 
` 











为 了 方便 演示 ， 本 章 的 所 有 实例 都 假设 模式 的 名 称 为 SMEAGOL, 


5.1 列举 模式 中 的 表 











1. 问题 

你 想 列 出 在 某 个 模式 里 创建 的 所 有 表 。 

2. 解决 方案 

下 面 的 每 种 解决 方案 都 假设 你 正在 使 用 SMEAGOL 模式 。 每 一 种 解决 方案 的 基本 思路 都 是 














一 致 的 : 检索 数据 库 里 的 某 个 系统 表 (或 者 视图 )， 你 创建 的 每 个 表 都 对 应 着 该 系统 表 里 
的 一 行 记录 。 

DB2 

查询 SYSCAT. TABLES, 











1 select tabname 
2 from syscat.tables 
3 where tabschema = 'SMEAGOL' 
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Oracle 
查询 SYS.ALL_TABLES 。 
select table_name 


from all_tables 
where owner = 'SMEAGOL' 


PostgreSQL, MySQL 和 SQL Server 
查询 INFORMATION SCHEMA.TABLES, 
1 select table name 


2 from information schema.tables 
3 where table schema - 'SMEAGOL' 


3. 讨论 

就 像 我 们 为 自己 的 应 用 程序 创建 表 和 视图 一 样 ， 数 据 库 系统 也 以 表 和 视图 的 形式 把 自身 的 
信息 提供 给 我 们 。 例 如 ，Oracle 数据 库 含 有 如 ALL. TABLES 这 样 的 内 容 丰 富 的 系统 视图 ， 可 
以 查询 关于 表 、 索 引 、 授 权 以 及 其 他 数据 库 对 象 的 信息 。 


oa 

















x Oracle 数据 库 的 目录 视图 其 实 就 是 普通 的 视图 。 它 们 基于 一 组 底层 表 ， 但 这 
心 些 表 中 的 信息 非常 不 便于 用 户 读 取 。 目 录 视 图 为 Oracle 数据 库 的 元 数据 提供 
和 全， 了 一 个 非常 易 用 的 外 部 接口 。 
































Oracle 的 系统 视图 和 DB2 的 系统 表 各 不 相同 。 另 外 ，PostgreSQL、MYySQL 和 SQL Server 
都 支持 信息 模式 (information schema) ， 这 是 按照 ISO SQL 标准 定义 的 一 组 视图 。 这 就 是 
为 什么 同一 条 查询 语句 能 够 适用 于 这 三 种 数据 库 。 


YL ria EL 

52 列举 字段 

1. 问题 

尔 想 列举 一 个 表 的 列 ( 即 字段 )， 以 及 它们 的 数据 类 型 和 在 表 中 的 位 置 。 

2. 解决 方案 

下 面 的 解决 方案 假设 你 希望 列 出 SMEAGOL 模式 里 的 EMP 表 的 各 列 ， 以 及 其 数据 类 型 和 位 
置 序号 。 


DB2 
查询 SYSCAT .COLUMNS。 





1 select colname, typename, colno 
2 from syscat.columns 

3 where tabname = 'EMP' 

4 and tabschema = 'SMEAGOL' 


Oracle 
查询 ALL. TAB. COLUMNS, 


1 select column name, data type, column id 
2 from all tab columns 
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'SMEAGOL ' 
' EMP' 


3 where owner 
4 and table name 


PostgreSQL, MySQL 和 SQL Server 
查询 INFORMATION SCHEMA .COLUMNS, 


1 select column name, data type, ordinal position 
2 from information schema.columns 

3 where table schema - 'SMEAGOL' 

4 and table name ' EMP' 


3. 讨论 
每 一 种 数据 库 都 提供 了 获取 详细 的 列 数据 的 方法 。 在 本 实例 中 ， 查 询 只 返回 了 列 名 、 数 据 
类 型 和 位 置 序号 。 除 此 之 外 ， 其 他 有 用 的 信息 还 包括 列 长 度 、 能 否 为 NuLL 以 及 默认 值 。 


5.3 列举 索引 列 























TIT 


























1. 问题 

你 想 列 出 某 个 表 的 索引 ， 包 括 构 成 索引 的 各 列 及 其 位 置 序号 (如 果 有 的 话 )。 

2. 解决 方案 

下 面 的 解决 方案 因数 据 库 的 不 同 而 有 所 差异 ， 但 都 假设 你 希望 列 出 SMEAGOL 模式 中 的 

















EMP 表 的 索引 信息 。 


DB2 
查询 SYSCAT.INDEXES 。 


1 select a.tabname, b.indname, b.colname, b.colseq 
2 from syscat.indexes a, 

3 syscat.indexcoluse b 

4 where a.tabname  - 'EMP' 

5 a.tabschema = 'SMEAGOL' 

6 and a.indschema - b.indschema 

7 a.indname = b.indname 


Oracle 
查询 SYS.ALL, IND COLUMNS, 


select table name, index name, column name, column position 
from sys.all ind columns 

where table name = 'EMP' 
and table owner - 'SMEAGOL' 


PostgreSQL 
查询 PG CATALOG.PG INDEXES 和 INFORMATION SCHEMA. COLUMNS , 


1 select a.tablename,a.indexname,b.column name 
2 from pg catalog.pg indexes a, 

3 information schema.columns b 

4 where a.schemaname - 'SMEAGOL' 

5 and a.tablename = b.table name 





MySQL 
使 用 SHOW INDEX 命令 。 


show index from emp 


SQL Server 
查询 SYS. TABLES, SYS.INDEXES, SYS.INDEX COLUMNS 和 SYS . COLUMNS, 


1 select a.name table name, 

2 b.name index name, 

3 d.name column name, 
4 c.index column id 

5 from sys.tables a, 

6 sys.indexes b, 

7 sys.index columns c, 
8 Sys.columns d. 


9 where a.object id - b.object id 
10 and b.object id = c.object id 
11 and b.index id = c.index id 
12 and c.object id - d.object id 
13 and c.column id = d.column id 
14 and a.name = 'EMP' 

3. 讨论 


说 到 查询 ， 很 重要 的 一 点 是 要 知道 哪些 列 有 索引 。 为 那些 经 常 被 用 来 过 滤 数 据 并 且 相 当 有 
区 分 度 的 列 添加 索引 ， 有 利于 提升 查询 的 效果 。 索 引 对 表 之 间 的 连接 查询 也 非常 有 帮助 。 
了 解 哪 些 列 被 加 入 了 索引 ， 能 够 有 效 地 避免 潜在 的 性 能 问题 。 此 外 ， 你 可 能 希望 查找 关于 
索引 自身 的 一 些 信息 : 遍历 深度 有 多 少 级 ， 有 多 少 个 不 同 的 键 ， 有 多 少 个 叶 节 点 ， 等 等 。 
可 以 通过 本 实例 中 的 解决 方案 所 查询 的 视图 和 表 来 获取 这 类 信息 。 


5.4 列举 约束 


1. 问题 

你 想 列 出 模式 中 某 个 表 的 约束 ， 以 及 与 这 些 约束 相关 的 列 。 例 如 ， 你 希望 找 出 EMP 表 的 约 
束 及 相关 的 列 。 

2. 解决 方案 


DB2 
查询 SYSCAT.TABCONST 和 SYSCAT.COLUMNS 。 




















1 select a.tabname, a.constname, b.colname, a.type 
2 from syscat.tabconst a, 

3 syscat.columns b 

4 where a.tabname = 'EMP' 

5 and a.tabschema = 'SMEAGOL' 

6 and a.tabname = b.tabname 

7 and a.tabschema = b.tabschema 


Oracle 
查询 SYS.ALL_CONSTRAINTS 和 SYS.ALL_CONS_COLUMNS 。 
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1 select a.table_name, 

2 a.constraint name, 

3 b.column name, 

4 a.constraint type 

5 from all constraints a, 

6 all cons columns b 

7 where a.table name - 'EMP' 

8 and a.owner = 'SMEAGOL' 

9 and a.table name - b.table name 
10 and a.owner - b.owner 

11 and a.constraint name - b.constraint name 


PostgreSQL, MySQL 和 SQL Server 
查询 INFORMATION SCHEMA.TABLE CONSTRAINTS 和 INFORMATION SCHEMA.KEY. COLUMN. USAGE , 


1 select a.table name, 

2 a.constraint name, 

3 b.column name, 

4 a.constraint type 

5 from information schema.table constraints a, 
6 information schema.key column usage b 
7 where a.table name - 'EMP' 

8 and a.table schem = 'SMEAGOL' 

9 and a.table name - b.table name 

10 and a.table schema - b.table schema 

11 and a.constraint name - b.constraint name 


3. 讨论 

毋庸 置疑 ， 约 束 是 关系 数据 库 的 重要 组 成 部 分 ， 我 们 甚至 不 需要 解释 为 什么 要 列 出 一 个 表 
的 约束 。 出 于 多 个 原因 ， 列 出 一 个 表 的 约束 是 非常 有 用 的 。 你 可 能 希望 找 出 那些 设 有 主键 
的 表 ， 也 可 能 想 知道 有 哪些 列 应 该 被 设置 为 外 键 却 没有 这 么 做 (例如 ， 子 表 的 数据 不 同 于 
父 表 ， 你 希望 知道 这 是 怎么 发 生 的 ) ， 或 者 你 可 能 希望 了 解 检查 约束 。( 一 些 列 可 以 为 Null 
吗 ? 它们 必须 满足 某 些 条 件 吗 ? ) 


5.5 列举 非 索引 外 键 

















1. 问题 

你 想 列 出 含有 非 索引 外 键 的 表 。 例 如 ， 你 希望 确认 EMP 表 的 外 键 是 否 加 入 了 索引 。 
2. 解决 方案 

DB2 


查询 SYSCAT.TABCONST、SYSCAT.KEYCOLUSE、SYSCAT.INDEXES 和 SYSCAT.INDEXCOLUSE。 


1 select fkeys.tabname, 

2 fkeys.constname, 

3 fkeys.colname, 

4 ind cols.indname 

5 from ( 

6 select a.tabschema, a.tabname, a.constname, b.colname 





7 from syscat.tabconst a, 

8 syscat.keycoluse b 

9 where a.tabname = 'EMP' 

10 and a.tabschema = 'SMEAGOL' 

11 and a.type EB 

12 and a.tabname = b.tabname 

13 and a.tabschema - b.tabschema 

14 ) fkeys 

15 left join 

16 ( 

17 select a.tabschema, 

18 a.tabname, 

19 a.indname, 

20 b.colname 

21 from syscat.indexes a, 

22 syscat.indexcoluse b 

23 where a.indschema - b.indschema 

24 and a.indname = b.indname 

25 ) ind cols 

26 on ( fkeys.tabschema - ind cols.tabschema 
27 and fkeys.tabname = ind cols.tabname 
28 and fkeys.colname = ind cols.colname ) 


29 where ind cols.indname is null 


Oracle 
查询 SYS. ALL. CONS COLUMNS, SYS.ALL CONSTRAINTS 和 SYS.ALL IND COLUMNS, 


1 select a.table name, 

2 a.constraint name, 
3 a.column name, 

4 c.index name 

5 from all cons columns a, 
6 all constraints b, 
7 

8 

9 


all ind columns c 


where a.table name - 'EMP' 
and a.owner = 'SMEAGOL' 
10 and b.constraint type = 'R' 
11 and a.owner - b.owner 
12 and a.table name - b.table name 
13 and a.constraint name = b.constraint name 
14 and a.owner = c.table owner (+) 
15 and a.table name = c.table name (+) 
16 and a.column name = c.column name (+) 
17 and c.index name is null 
PostgreSQL 


查询 INFORMATION SCHEMA.KEY COLUMN USAGE, INFORMATION SCHEMA.REFERENTIAL, CONSTRAINTS, 
INFORMATION  SCHEMA.COLUMNS 和 PG CATALOG.PG INDEXES, 


1 select fkeys.table name, 

2 fkeys.constraint name, 
3 fkeys.column name, 

4 ind cols.indexname 

5 from ( 
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6 select 

7 

8 

9 

10 from 

11 

12 where 

13 and 

14 and 

15 and 

16 

17 

18 

19 select 

20 from 

21 

22 where 

23 and 

24 

25 on 

26 

27 

28 where 
MySQL 





a.constraint schema, 

a.table name, 

a.constraint name, 

a.column name 

information schema.key column usage a, 
information schema.referential constraints b 


a.constraint name = b.constraint name 
a.constraint schema = b.constraint schema 
a.constraint schema = 'SMEAGOL' 

a.table name - 'EMP' 

) fkeys 

left join 


( 

a.schemaname, a.tablename, a.indexname, b.column name 
pg. catalog.pg indexes a, 

information schema.columns b 

a.tablename = b.table name 

a.schemaname - b.table schema 

) ind cols 

( fkeys.constraint schema - ind cols.schemaname 
and fkeys.table name = ind cols.tablename 

and fkeys.column name = ind cols.column name ) 
ind cols.indexname is null 


使 用 SHOW INDEX 命令 获取 诸如 索引 名 称 、 索 引 列 和 列 位 置 序号 之 类 的 索引 信息 。 除 此 之 
外 ， 我 们 还 可 以 通过 查询 INFORMATION_SCHEMA.KEY_COLUMN_USAGE 列 出 表 的 外 键 。 对 于 
MySQL 5 而 言 ， 外 键 虽然 默认 是 加 入 索引 的 ， 但 事实 上 却 可 以 被 删 掉 。 要 确认 外 键 列 
的 索引 是 否 已 经 被 删除 ， 可 以 针对 特定 的 表 执 行 SHOW INDEX 命令 ， 并 比较 其 输出 结果 与 
INFORMATION SCHEMA.KEY COLUMN USAGE.COLUMN NAME 的 异同 。 如 果 KEY COLUMN USAGE 里 有 
对 应 的 COLUMN, NAME, [Hi SHOW INDEX 输出 的 结果 里 却 没 有 ， 那 么 就 说 明 该 列 没有 索引 。 
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查询 SYS.TABLES、SYS.FOREIGN_KEYS、SYS.COLUMNS、SYS.INDEXES 和 SYS. INDEX COLUMNS, 


select 


1 

2 

3 

4 

5 from 
6 select 
7 

8 

9 


10 
11 from 
12 
13 
14 on 
15 
16 
17 
18 


fkeys.table_name, 
fkeys.constraint_name, 
fkeys.column_name, 

ind cols.index name 

( 

a.object id, 

d.column id, 

a.name table name, 

b.name constraint name, 
d.name column name 
sys.tables a 

join 

sys.foreign keys b 

(  a.name = 'EMP' 
and a.object id - b.parent object id 
) 

join 
sys.foreign key columns c 





19 on ( b.object_id = c.constraint object id ) 


20 join 
21 sys.columns d 
22 on (  c.constraint column id = d.column id 
23 and a.object id = d.object id 
24 ) 
25 ) fkeys 
26 left join 
27 ( 
28 select a.name index name, 
29 b.object id, 
30 b.column id 
31 from sys.indexes a, 
32 sys.index columns b 
33 where a.index id = b.index id 
34 ) ind cols 
35 on ( fkeys.object id = ind cols.object id 
36 and fkeys.column id = ind cols.column id ) 
37 where ind cols.index name is null 
3. 讨论 


当 修改 数据 时 ， 每 一 种 数据 库 的 锁 机 制 都 不 尽 相 同 。 如 果 通 过 外 键 实 现 父 子 关系 ， 那 么 为 
子 表 里 对 应 的 列 加 上 索引 有 助 于 减少 锁 (详情 请 参考 各 数据 库 的 帮助 文档 )。 还 有 一 种 应 
用 场景 : 子 表 和 父 表 常用 外 键 列 做 连接 查询 ， 因 而 加 上 索引 有 助 于 提升 查询 性 能 。 


5.6 用 SQL 生成 SQL 


1. 问题 
你 想 生 成 动态 的 SQL 语句 ， 例 如 你 的 目的 是 将 某 些 维护 任务 自动 化 。 你 希望 完成 3 项 任 
务 : 计算 各 个 表 的 行 数 ， 禁 用 各 个 表 的 外 键 约 束 ， 根 据 表 里 的 数据 生成 插入 脚本 。 
2. 解决 方案 
基本 思路 是 使 用 字符 串 拼接 SQL 语句 ， 通 过 查询 某 些 表 来 获取 需要 填 和 人 的 数据 (例如 数 
据 库 对 象 名 称 )。 注 意 ， 这 些 查 询 仅 生成 SQL 语句 。 你 需要 手动 或 者 通过 其 他 方式 运行 
脚本 ， 以 执行 这 些 SQL 语句 。 下 面 的 示例 都 是 针对 Oracle 数据 库 的 。 对 于 其 他 数据 库 而 
言 ， 做 法 应 该 极其 相似 ， 但 是 数据 字典 表 的 名 称 以 及 日 期 格式 之 类 的 细节 或 有 不 同 。 下 
面 的 输出 结果 来 自我 的 笔记 本 电脑 上 的 一 个 Oracle 实例 。 你 的 计算 机 上 的 执行 结果 当然 
会 有 所 不 同 。 

/* 生成 SQL 以 计算 各 个 表 的 行 数 */ 
























































select 'select count(*) from '||table_name||';' cnts 
from user_tables; 


select count(*) from ANT; 
select count(*) from BONUS; 
select count(*) from DEMO1; 
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select count(*) from DEMO2; 
select count(*) from DEPT; 
select count(*) from DUMMY; 
select count(*) from EMP; 
select count(*) from EMP_SALES; 
select count(*) from EMP_SCORE; 
select count(*) from PROFESSOR; 
select count(*) from T; 

select count(*) from T1; 

select count(*) from T2; 

select count(*) from T3; 

select count(*) from TEACH; 
select count(*) from TEST; 
select count(*) from TRX_LOG; 
select count(*) from X; 


/* 禁用 所 有 表 的 外 键 约束 */ 





select 'alter table '||table_name|| 
' disable constraint '||constraint name||';' cons 
from user constraints 
where constraint type - 'R'; 
CONS 


alter table ANT disable constraint ANT FK; 

alter table BONUS disable constraint BONUS FK; 

alter table DEMO1 disable constraint DEMO1 FK; 

alter table DEMO2 disable constraint DEMO2 FK; 

alter table DEPT disable constraint DEPT FK; 

alter table DUMMY disable constraint DUMMY FK; 

alter table EMP disable constraint EMP FK; 

alter table EMP SALES disable constraint EMP SALES FK; 
alter table EMP SCORE disable constraint EMP SCORE FK; 
alter table PROFESSOR disable constraint PROFESSOR FK; 


/* 根据 EMP 表 的 某 些 列 生成 插入 脚本 */ 





select 'insert into emp(empno,ename,hiredate) '||chr(10)|| 
'values( '|[|empno[||', '||''''||ename 
I|  , to date('[|''"''[|hiredate| |'' ') );' inserts 
from emp 


where deptno - 10; 


INSERTS 


insert into emp(empno,ename,hiredate) 
values( 7782,'CLARK',to date('09-JUN-1981 00:00:00') ); 


insert into emp(empno,ename,hiredate) 
values( 7839,'KING',to date('17-NOV-1981 00:00:00') ); 


insert into emp(empno,ename,hiredate) 
values( 7934,'MILLER' ,to date('23-JAN-1982 00:00:00') ); 





3. 讨论 

















若 要 创建 可 移植 的 脚本 (如 用 于 在 多 个 环境 下 进行 测试 )， 用 SQL 生成 SQL 的 做 法 尤其 有 





用 。 另 外 ， 正 如 上 面 的 例子 所 示 ， 对 于 执行 批 处 理 维护 任务 以 及 一 次 性 找 出 与 多 种 对 象 相 





关 的 信息 ， 用 SQL 生成 SQL 的 做 法 也 非常 有 用 。 这 种 方法 简单 易学 ， 你 练习 的 次 数 越 多 ， 
它 就 会 变 得 越 简单 。 本 例 只 是 希望 向 你 展示 一 下 如 何 创建 属于 你 自己 的 动态 SQL 脚本 ， 坦 
白 来 说 ， 这 并 不 难 做 到 。 你 只 需要 不 断 尝试 就 能 熟练 掌握 其 中 的 技巧 。 


5.7 ”描述 Oracle 数 据 字 典 视图 




















1. 问题 


你 使 用 的 是 Oracle 数据 库 ， 但 不 记得 Oracle 数据 库 有 哪些 可 用 的 数据 字典 视 菇 
官方 文档 。 





们 包含 了 哪些 列 。 更 糟糕 的 是 ， 你 不 方便 查找 
2. 解决 方案 


本 实例 仅 适 用 于 Oracle 数据 库 。Oracle 数据 库 不 仅 具 有 一 组 内 容 丰富 的 数据 字典 视 医 
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通过 另 一 组 数据 字典 视图 为 它们 提供 详细 的 注解 。 这 真是 精彩 的 循环 。 
查询 DICTIONARY 视图 ， 并 列 出 数据 字典 视图 及 其 目的 。 














select table_name, comments 
from dictionary 
order by table_name; 


TABLE_NAME COMMENTS 





ALL_ALL_TABLES Description of all object and relational 
tables accessible to the user 


ALL_APPLY Details about each apply process that 
dequeues from the queue visible to the 
current user 


查询 DICT_COLUMNS， 并 找 出 某 个 数据 字典 视图 








select column_name, comments 
from dict_columns 
where table name = 'ALL_TAB_COLUMNS ' ; 


的 各 列 含义 。 


COLUMN NAME COMMENTS 

OWNER 

TABLE NAME Table, view or cluster name 

COLUMN, NAME Column name 

DATA TYPE Datatype of the column 

DATA TYPE MOD Datatype modifier of the column 
DATA TYPE OWNER Owner of the datatype of the column 
DATA LENGTH Length of the column in bytes 


DATA PRECISION Length: decimal digits (NUMBER) or binary 
digits (FLOAT) 
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3. 讨论 
以 前 ，Oracle 数据 库 的 官方 文档 不 像 现 在 这 样 能 通过 互联 网 方便 地 查看 ， 因 而 在 当时 ， 
DICTIONARY 和 DICT_COLUMNS 视图 无 疑 是 非常 方便 的 工具 。 仅 仅 借助 这 两 个 视图 ， 你 就 能 学 

习 到 其 他 全 部 数据 字典 视图 的 知识 ， 进 而 了 解 整个 数据 库 。 时 至 今日 ， 了 解 DICTIONARY 和 
DICT COLUMNS 视图 也 非常 方便 。 有 时 你 可 能 会 忘记 某 个 数据 库 对 象 对 应 的 数据 字典 视图 名 
称 ， 你 可 以 用 一 个 含有 通配符 的 查询 来 找到 它 。 例 如 ， 要 知道 查询 哪个 视图 能 得 到 某 个 模 
式 下 的 全 部 表 。 

select table_name, comments 
from dictionary 


where table_name LIKE '%TABLE%' 
order by table name; 


上 述 查 询 获取 了 所 有 名 称 中 含有 TABLE 一 词 的 数据 字典 视图 。 在 这 里 ， 我 们 利用 了 Oracle 
数据 库 非 常 一 致 的 数据 字典 视图 命名 习惯 。 描 述 表 的 视图 名 称 里 往往 都 带 有 TABLE, CRISE 
候 会 使 用 TABLE 的 缩写 形式 TAB， 例 如 ALL. TAB. COLUMNS, ) 
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字符 串 处 理 








本 章 主要 介绍 SQL 的 字符 串 处 理 。 注 意 ，SQL 并 不 专门 用 于 处 理 复杂 的 字符 串 。 你 可 能 
也 会 发 现 有 时 使 用 SQL 处 理 字符 串 会 非常 麻烦 ， 令 人 诅 走 。 尽 管 SQL 存在 这 些 不 足 之 处 ， 
各 种 数据 库 管理 系统 仍然 提供 了 许多 非常 有 用 的 内 置 国 数 ， 我 会 尽量 创造 性 地 利用 好 它 
们 。 本 章 尤 其 能 反映 出 我 在 前 言 中 想 要 表达 的 意图 : SQL 有 好 的 一 面 ， 也 有 坏 的 甚至 令 人 
厌恶 的 一 面 。 我 希望 在 你 读 过 本 章 的 内 容 之 后 ， 对 于 SQL 在 字符 串 处 理 方面 能 做 什么 和 不 
能 做 什么 能 有 更 加 深入 的 认识 。 大 多 数 情况 下 ， 你 会 惊喜 地 发 现 SQL 能 非常 方便 地 处 理 许 
多 字符 串 解 析 和 转换 操作 ， 而 有 时 你 又 可 能 会 惊讶 于 某 些 SQL 特性 竟然 只 是 为 了 某 种 特定 
的 任务 而 准备 的 。 

本 章 的 第 一 个 实例 非常 重要 ， 因 为 后 续 的 一 些 实例 的 解决 方案 会 用 到 它 。 大 多 数 情况 下 ， 
你 需要 有 逐 字 遍 历 字符 串 的 能 力 。 但 是 ， 使 用 SQL 进行 这 样 的 操作 并 不 容易 。 因 为 SQL 
没有 Loop 循环 功能 (Oracle 的 MODEL 子 句 除外 )， 我 们 不 得 不 模拟 出 一 种 循环 操作 来 实现 
字符 串 遍 历 。 我 把 这 种 操作 称 为 “遍历 字符 串 "， 并 在 第 一 个 实例 里 解释 了 该 技巧 。 这 是 
SQL 字符 串 解析 处 理 的 基础 部 分 ， 本 章 的 几乎 所 有 实例 都 参考 或 者 使 用 了 这 一 技巧 。 我 强 
烈 建议 你 先 理解 它 的 工作 原理 。 


6.1 遍历 字符 串 
1. 问题 


你 想 遍 历 一 个 字符 串 ， 并 以 一 个 字符 一 行 的 形式 把 它们 显示 出 来 ， 但 SQL 没有 Loop 循环 功 
能 。 例 如 ， 你 想 把 EMP 表 的 ENAME 等 于 KING 的 字符 串 拆 开 来 显示 为 4 行 ， 每 行 一 个 字符 。 
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2. 解决 方案 

使 用 笛 卡 儿 积 生成 以 每 行 一 个 字符 的 形式 来 显示 字符 串 所 需要 的 行 数 。 然 后 ， 使 用 数据 库 
内 置 的 字符 串 解析 函数 提取 我 们 感 兴趣 的 字符 (如果 是 SQL Server 的 话 ， 要 用 SUBSTRING 
替换 SUBSTR ) 。 





1 select substr(e.ename,iter.pos,1) as C 

2 from (select ename from emp where ename = 'KING') e, 
3 (select id as pos from t10) iter 

4 where iter.pos <= length(e.ename) 


C 


cQ Z H >` 


3. 讨论 

要 遍历 一 个 字符 串 里 的 全 部 字符 ， 关 键 在 于 要 先 和 另 一 个 表 做 连接 查询 ， 该 表 必 须 有 足 
够 多 的 行 以 保证 循环 操作 的 次 数 。 本 例 使 用 的 是 T10 表 ， 该 表 有 10 行 记 录 ( 它 只 有 一 列 ， 
列 名 为 ID， 它 的 值 分 别 是 从 1 到 10)。 也 就 是 说 ， 上 述 查 询 最 多 返回 10 行 。 

下 面 的 例子 省 略 了 ENAME 解析 处 理 ， 仅 展示 了 E 和 ITER 的 笛 卡 儿 积 (例如 ， 某 个 员工 的 名 
字 和 T10 表 的 10 行 数据 的 笛 卡 儿 积 ) 。 


select ename, iter.pos 
from (select ename from emp where ename - 'KING') e, 
(select id as pos from t10) iter 





ENAME POS 
KING 1 
KING 2 
KING 3 
KING 4 
KING 5 
KING 6 
KING 7 
KING 8 
KING 9 
KING 10 





ARIILE E 的 行 数 是 1， 而 内 磐 视图 ITER 的 行 数 是 10， 所 以 得 到 的 笛 卡 儿 积 就 是 10 fr. 




















把 T10 表 作 为 一 个 数据 透视 表 是 常用 技巧 。 
这 个 解决 方案 使 用 WHERE 子 句 在 查询 语句 返回 了 4 行 数据 之 后 跳出 了 循环 。 为 了 保证 结果 集 
的 行 数 等 于 给 定员 工 名 字 的 字符 个 数 ，WHERE 子 句 把 ITER.P0S <= LENGTH(E.ENAME) 作为 条 件 。 
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select ename, iter.pos 
from (select ename from emp where ename - 'KING') e, 
(select id as pos from t10) iter 
where iter.pos «- length(e.ename) 


ENAME POS 
KING 1 
KING 2 
KING 3 
KING 4 


现在 我 们 得 到 的 记录 行 数 和 E.ENAME 的 字符 数 一 样 多 ， 接 下 来 可 以 把 ITER.POS 作为 SUBSTR 
的 参数 ， 这 样 就 能 遍历 字符 串 里 的 每 个 字符 。ITER.Pos 的 值 会 逐 行 递增 ， 这 样 每 一 行 都 能 
从 E.ENAME 里 提取 出 一 个 连续 的 字符 。 这 就 是 该 解决 方案 的 工作 原理 


根据 不 同 的 任务 目标 ， 我 们 或 许 不 需要 为 一 个 字符 串 里 的 每 个 字符 都 产生 一 行 数据 。 下 面 
的 查询 展示 了 一 个 遍历 E.ENAME 的 例子 ， 但 是 查询 结果 打印 的 却 是 字符 串 的 不 同 部 分 (不 
只 是 单个 字符 )。 


select substr(e.ename,iter.pos) a, 
substr(e.ename, length(e.ename)-iter.pos+1) b 
from (select ename from emp where ename = 'KING') e, 
(select id pos from t10) iter 
where iter.pos «- length(e.ename) 












































A B 
KING G 
ING NG 
NG ING 
G KING 





在 本 章 的 实例 中 ， 最 常见 的 使 用 场景 包括 遍历 字符 串 并 为 其 中 的 每 个 字符 产生 一 行 数据 ， 
或 者 遍历 字符 串 并 根据 某 些 特别 的 字符 或 分 隔 符 来 生成 相应 行 数 的 记录 。 
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1. 问题 

PB Fir e rik A p| S, JEELS ERE HI SQL 产生 如 下 所 示 的 结果 。 
QMARKS 
da Y, 


beavers' teeth 


2. 解决 方案 
下 面 的 3 个 SELECT 语句 展示 了 使 用 引号 的 不 同方 式 : 在 一 个 字符 串 的 中 间 插 入 引号 和 单独 
使 用 引号 。 








7 
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1 select 'g''day mate' qmarks from t1 union all 


2 select 'beavers'' teeth' from t1 union all 
3 select '''' from t1 
3. 讨论 

















讨论 引号 的 处 理 时 ， 把 它 和 圆 括号 做 类 比 通常 会 更 容易 理解 。 我 们 如 果 写 下 左 括号 ， 也 必 
须 接 着 写 下 右 括 号 。 引 号 也 是 一 样 。 要 记 住 ， 在 任何 字符 串 里 引号 的 个 数 都 应 该 是 一 个 偶 
数 。 要 想 在 字符 串 中 间 插 入 引号 ， 需 要 使 用 两 个 引号 才 行 。 

select 'apples core', 'apple''s core', 


case when '' is null then O else 1 end 
from t1 























'APPLESCORE 'APPLE''SCOR CASEWHEN' 'ISNULLTHENOELSE1END 


apples core apple's core 0 
下 面 的 查询 用 于 揭示 引号 的 真正 作用 。 两 个 外 层 的 引号 用 于 定义 一 个 字符 串 常量 ， 在 该 字 
符 串 常量 里 还 使 用 了 两 个 引号 来 代表 一 个 引号 ， 我 们 实际 上 希望 它 显 示 的 内 容 就 是 这 一 个 
9|. 


select '''' as quote from t1 














7 























Q 














处 理 引 号 时 ， 还 要 记 住 如 果 一 个 字符 串 里 只 包含 两 个 引号 ， 并 且 这 两 个 引号 中 间 没 有 任何 
字符 ， 那 么 这 个 字符 串 是 Null, 


6.3 统计 字符 出 现 的 次 数 























1. 问题 

你 想 统计 某 个 字符 或 者 子 字符 串 在 给 定 字符 串 里 出 现 的 次 数 ， 考 虑 如 下 的 字符 串 。 
10,CLARK,MANAGER 

你 想 知道 该 字符 串 里 有 多 少 个 逗号 。 

2. 解决 方案 





字符 串 的 总 长 度 减 去 去 掉 喜 号 之 后 的 字符 串 长 度 ， 就 得 到 了 去 号 的 个 数 。 所 有 的 数据 库 管 
理 系 统 都 提供 了 获取 字符 串 长 度 的 函数 以 及 从 字符 串 里 删除 字符 的 函数 。 大 多 数 情况 下 ， 
这 些 函 数 分 别 是 LENGTH 和 REPLACE (SQL Server 用 户 需 要 用 内 置 函数 LEN 替换 LENGTH) 。 























1 select (Length( '10 ,CLARK ,MANAGER ' ) - 
2 length(replace('10,CLARK,MANAGER' , ' , ' ,' ')))/length(' , ') 
3 as cnt 
4 from tl 
3. 讨论 


使 用 简单 的 减法 运算 就 可 以 解决 这 个 问题 。 第 1 行 调用 LENGTH 函数 获取 字符 串 总 长 
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度 ， 第 2 行 仍然 调用 LENGTH ER r ak BUTS A ss BI SEE HR eE, ghi m BS NER UL E BJ T 
REPLACE 函数 。 

把 上 述 两 个 长 度 相 减 ， 得 到 的 差 值 就 是 字符 串 里 逗号 的 个 数 。 最 后 的 除法 运算 是 用 上 述 两 
个 长 度 的 差 值 除 以 我 们 正在 搜索 的 那个 字符 串 长 度 。 如 果 被 搜索 的 字符 串 的 长 度 大 于 1 的 
话 ， 就 必须 使 用 除法 运算 。 下 面 的 例子 统计 在 字符 串 HELLO HELLO 中 出 现 了 多 少 个 LL, ZH 
果 没 有 进行 除法 运算 的 话 ， 就 不 会 得 到 正确 的 结果 。 


select 














了 
































(length('HELLO HELLO')- 

length(replace('HELLO HELLO','LL','')))/length('LL') 

as correct_cnt, 

(length('HELLO HELLO')- 

length(replace('HELLO HELLO','LL',''))) as incorrect cnt 
from t1 


CORRECT, CNT INCORRECT, CNT 





2 4 
ANB rz A 

1. 问题 
你 想 从 你 的 数据 里 删除 指定 的 字符 ， 考 虑 下 面 的 结果 集 

ENAME SAL 

SMITH 800 

ALLEN 1600 

WARD 1250 

JONES 2975 

MARTIN 1250 

BLAKE 2850 

CLARK 2450 

SCOTT 3000 

KING 5000 

TURNER 1500 

ADAMS 1100 

JAMES 950 

FORD 3000 

MILLER 1300 





你 希望 从 上 面 的 数据 里 删除 所 有 的 0 和 元 音字 母 ， 并 将 删除 后 的 值 显示 在 STRIPPED1 列 和 
STRIPPED2 列 中 。 











ENAME STRIPPED1 SAL STRIPPED2 
SMITH SMTH 800 8 

ALLEN LLN 1600 16 

WARD WRD 1250 125 

JONES JNS 2975 2975 
MARTIN MRTN 1250 125 
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BLAKE 
CLARK 
SCOTT 
KING 
TURNER 
ADAMS 
JAMES 
FORD 
MILLER 


2. 解决 方案 


每 个 数据 库 管 理 系 统 都 提供 了 可 以 删除 一 个 字符 串 里 不 想 要 的 字符 的 函数 ， 其 中 最 有 用 的 


BLK 2850 285 
CLRK 2450 245 
SCTT 3000 3 
KNG 5000 5 
TRNR 1500 15 
DMS 1100 11 
JMS 950 95 
FRD 3000 3 
MLLR 1300 13 






































函数 是 REPLACE 和 TRANSLATE, 


DB2 


使 用 内 置 函 数 TRANSLATE 和 REPLACE 删除 不 想 要 的 字符 和 字符 串 。 


1 select ename, 
2 replace(translate(ename,'aaaaa','AEIOU'),'a','') stripped1, 
3 sal, 
4 replace(cast(sal as char(4)),'0','') stripped2 
5 from emp 
MySQL 和 SQL Server 


MySQL 和 SQL Server 没有 提供 TRANSLATE 函数 ， 


1 
2 
3 
4 
5 
6 
7 
8 
9 
1 





因而 需要 多 次 调用 REPLACE 函数 。 


select ename, 


replace( 

replace( 

replace( 

replace( 
replace(ename, 'A' ,' ') ,'E',''),'I',''),'0',''),'U','") 
as strippedi, 

sal, 

replace(sal,0,'') stripped2 


0 from emp 


Oracle 和 PostgreSQL 
使 用 内 置 函 数 TRANSLATE 和 REPLACE 删除 不 想 要 的 字符 和 字符 串 。 


+ 
2 
3 
4 
5 
6 


3. 讨论 


内 置 函数 REPLACE 会 删除 0。 为 了 删除 元 音字 母 ， 先 使 用 TRANSLATE KRGE EE SE BERI pk: 
一 个 特殊 的 字符 (我 选择 了 字母 3， 当然 也 可 以 选 其 他 字符 )， 然 后 使 用 REPLACE 函数 删除 


select ename, 


replace(translate(ename,'AEIOU','aaaaa'),'a') 
as stripped1, 

sal, 

replace(sal,0,'') as stripped2 


from emp 





这 个 特殊 字符 。 





65 分离 数字 和 字符 数据 
1. 问题 


你 很 不 季 地 把 数字 和 字符 数据 混合 存放 进 一 列 。 你 想 把 其 中 的 数字 数据 和 字符 数据 分 开 ， 
考虑 如 下 的 结果 集 。 






































DATA 
SMITH800 
ALLEN1600 
WARD1250 
JONES2975 
MARTIN1250 
BLAKE2850 
CLARK2450 
SCOTT3000 
KING5000 
TURNER1500 
ADAMS1100 
JAMES950 
FORD3000 
MILLER1300 

你 希望 得 到 如 下 的 结果 集 。 
ENAME SAL 
SMITH 800 
ALLEN 1600 
WARD 1250 
JONES 2975 
MARTIN 1250 
BLAKE 2850 
CLARK 2450 
SCOTT 3000 
KING 5000 
TURNER 1500 
ADAMS 1100 
JAMES 950 
FORD 3000 
MILLER 1300 

2. 解决 方案 


使 用 内 置 函 数 TRANSLATE 和 REPLACE 来 分 离 字 符 数据 和 数字 数据 。 与 本 章 的 其 他 实例 类 似 ， 
此 处 的 技巧 在 于 使 用 TRANSLATE 函数 把 多 种 字符 替换 成 一 个 指定 的 字符 。 这 样 一 来 只 要 用 
一 个 数字 就 能 代表 所 有 数字 ， 一 个 字符 就 能 代表 所 有 字符 ， 因 此 我 们 就 不 再 需要 逐一 查找 
多 个 数字 或 字符 了 。 

DB2 

使 用 TRANSLATE 和 REPLACE 函数 分 离 数 字 和 字符 数据 。 
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1 select replace( 
2 translate(data,'0000000000','0123456789'),'0','') ename, 
3 cast( 
4 replace( 
5 translate(lower(data),repeat('z',26), 
6 'abcdefghijklmnopqrstuvwxyz'),'z','') as integer) sal 
7 from ( 
8 select ename||cast(sal as char(4)) data 
9 from emp 
10 )x 
Oracle 
使 用 TRANSLATE 和 REPLACE PAZ BB FERIA s 
1 select replace( 
2 translate(data,'0123456789','0000000000'),'0') ename, 
3 to number( 
4 replace( 
5 translate(lower(data), 
6 'abcdefghijklmnopqrstuvwxyz', 
7 rpad('z',26,'z')),'z')) sal 
8 from ( 
9 select ename||sal data 
10 from emp 
11 ) 
PostgreSQL 
使 用 TRANSLATE 和 REPLACE 函数 分 离 数 字 和 字符 数据 。 
1 select replace( 
2 translate(data,'0123456789','0000000000'),'0','') as enane, 
3 cast( 
4 replace( 
5 translate(lower(data), 
6 'abcdefghijklmnopqrstuvwxyz', 
7 rpad('z',26,'z')),'z','') as integer) as sal 
8 from( 
9 select ename||sal as data 
10 from emp 
11 )x 
3. 讨论 


每 个 数据 库 管 理 系统 的 语法 都 略 有 不 同 ， 但 方法 是 一 样 的 。 在 本 闻 的 讨论 中 ， 我 将 以 
Oracle 解决 方案 为 主 。 解 决 本 问题 的 关键 在 于 分 离 数 字 和 字符 数据 ， 使 用 TRANSLATE 和 
REPLACE 图 数 可 以 实现 这 一 点 。 为 了 提取 数字 ， 首 先 用 TRANSLATE 函数 把 所 有 的 字符 数据 分 
离 出 来 。 
select data, 
translate(lower(data), 
'abcdefghijklmnopqrstuvwxyz', 
rpad('z',26,'z')) sal 
from (select ename||sal data from emp) 














SMITH800 zzzzz800 
ALLEN1600 zzzzz1600 
WARD1250 zzzz1250 
JONES2975 zzzzz2975 
MARTIN1250 zzzzzz1250 
BLAKE2850 zzzzz2850 
CLARK2450 zzzzz2450 
SCOTT3000 zzzzz3000 
KING5000 zzzz5000 
TURNER1500 zzzzzz1500 
ADAMS1100 zzzzz1100 
JAMES950 zzzzz950 
FORD3000 zzzz3000 
MILLER1300 zzzzzz1300 


使 用 TRANSLATE KAGE AA ERE FAAR RAS TEBEz. PRU EH REPLACE 函数 删除 
所 有 的 小 写字 母 z， 这 样 就 只 留 下 数字 字符 ， 我 们 可 以 将 其 转换 为 一 个 数字 。 


select data, 
to_number( 
replace( 
translate(lower(data), 
'abcdefghijklmnopqrstuvwxyz', 
rpad('z',26,'z')),'z')) sal 
from (select ename||sal data from emp) 








DATA SAL 
SMITH800 800 
ALLEN1600 1600 
WARD1250 1250 
JONES2975 2975 
MARTIN1250 1250 
BLAKE2850 2850 
CLARK2450 2450 
SCOTT3000 3000 
KING5000 5000 
TURNER1500 1500 
ADAMS1100 1100 
JAMES950 950 
FORD3000 3000 
MILLER1300 1300 


为 了 提取 非 数 字 字符 ， 需 要 使 用 TRANSLATE 函数 隔离 数字 字符 。 


select data, 
translate(data,'0123456789','0000000000') ename 
from (select ename||sal data from emp) 


DATA ENAME 
SMITH800 SMITH0OO 
ALLEN1600 ALLEN0000 
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WARD1250 WARD0000 

JONES2975 JONES0000 

MARTIN1250 MARTIN0000 

BLAKE2850 BLAKE0000 

CLARK2450 CLARK0000 

SCOTT3000 SCOTTOOO0 

KING5000 KING0000 

TURNER1500 TURNER0000 

ADAMS1100 ADAMSO000 

JAMES950 JAMES000 

FORD3000 FORD0000 

MILLER1300 MILLER0000 
使 用 TRANSLATE AREARE PAR IU 0, PATERET REPLACE 函数 删除 每 条 记录 中 出 
现 的 0， 剩 下 的 就 只 有 非 数字 字符 。 

select data, 

replace(translate(data,'0123456789','0000000000'),'0') ename 
from (select ename||sal data from emp) 

DATA ENAME 

SMITH800 SMITH 

ALLEN1600 ALLEN 

WARD1250 WARD 

JONES2975 JONES 

MARTIN1250 MARTIN 

BLAKE2850 BLAKE 

CLARK2450 CLARK 

SCOTT3000 SCOTT 

KING5000 KING 

TURNER1500 TURNER 

ADAMS1100 ADAMS 

JAMES950 JAMES 

FORD3000 FORD 

MILLER1300 MILLER 
最 后 ， 将 上 述 两 个 方法 结合 起 来 就 是 本 问题 的 解决 方案 

3 nir A = Hh =a ri 4 

6.6 判断 含有 字母 和 数字 的 字符 串 
1. 问题 
你 想 从 一 个 表 里 篇 选 出 部 分 行 数据 ， 往 选 条 件 是 你 感 兴 趣 的 那个 列 只 包含 字母 和 数字 字 








符 ， 考 虑 下 面 的 视图 V 


create view V as 














select ename as data 


from emp 
where deptno=10 
union all 
select ename||', 
from emp 


where deptno=20 


$'|| cast(sal as char(4)) ||'.00' 


(SQL Server 用 户 需要 把 字符 串 连 接 操作 符 || 替换 为 +)。 


as data 





union all 

select ename|| cast(deptno as char(4)) as data 
from emp 

where deptno-30 


视图 v 代表 了 你 要 查询 的 表 ， 它 包含 如 下 所 示 的 数据 。 


MILLER 

SMITH, $800.00 
JONES, $2975.00 
SCOTT, $3000.00 
ADAMS, $1100.00 
FORD, $3000.00 
ALLEN30 

WARD30 

MARTIN30 
BLAKE30 
TURNER30 
JAMES30 








AR 





如 下 所 示 的 记录 。 





v 中 提取 H 








MARTIN30 
BLAKE30 
TURNER30 
JAMES30 


上 总之， 你 想 过 滤 掉 那些 除了 字母 和 数字 还 包含 其 他 字符 的 行 。 


2. 解决 方案 
首先 找 出 字符 串 中 所 有 可 














2b 
HEU 











8 现 的 非 字 母 数字 字符 ， 这 似乎 是 更 为 直观 的 解决 思路 。 但 恰 








恰 与 之 相反 ， 我 们 发 现 从 反 














看 着手 更 容易 : 首先 找 出 所 有 的 字母 字符 和 数字 字符 。 如 此 一 


来 ， 先 把 所 有 的 字母 字符 和 数字 字符 转换 成 一 个 单一 的 字符 ， 然 后 就 能 把 它们 当 作 一 个 字 


符 。 这 么 做 的 好 处 是 ， 经 过 转换 处 至 








之 后 这 些 字母 和 数字 可 以 被 当 作 一 个 整体 来 操作 。 一 


且 生 成 了 原 有 字符 串 的 副本 ， 并 把 其 中 的 字母 字符 和 数字 字符 替换 成 某 个 指定 的 字符 ， 很 








容易 就 可 以 将 字母 字符 和 数字 字符 从 其 他 字符 中 分 离 出 来 。 

DB2 

使 用 TRANSLATE 函数 将 字母 字符 和 数字 字符 都 替换 成 单一 字符 ， 然 后 找 吕 
还 包含 其 他 字符 的 行 。 对 于 DB2 用 户 来 说 ， 需 要 在 视图 
为 数据 类 型 转换 错误 而 导致 视图 包 
































a= 








V 中 调用 CAST 国 数 。 否 则 ， 
建 失败 。 转 换 为 CHAR 类 型 时 尤其 要 注意 ， 


H 那 些 除 了 该 字符 
会 因 


因为 CHAR 的 
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长 度 是 固定 的 (长 度 不 足 的 部 分 会 被 填充 上 )。 











1 select data 

2 from V 

3 where translate(lower(data), 

4 repeat('a',36), 

5 '0123456789abcdefghijklmnopqrstuvwxyz') = 
6 repeat('a',length(data)) 


MySQL 
在 MySQL rb, US v 的 语法 稍 有 不 同 。 


create view V as 

select ename as data 
from emp 

where deptno=10 

union all 

select concat(ename,', $',sal,'.00') as data 
from emp 

where deptno-20 

union all 

select concat(ename,deptno) as data 
from emp 

where deptno-30 


使 用 正则 表达 式 能 方便 地 找 出 包含 非 字母 数字 字符 的 行 。 


1 select data 
2 from V 
3 where data regexp '[^0-9a-zA-Z]' = 0 














Oracle 和 PostgreSQL 

使 用 TRANSLATE 国 数 把 字母 字符 和 数字 字符 替换 成 单一 字符 ， 然 后 找 出 那些 除了 该 字符 还 
包含 其 他 字符 的 行 。 对 于 Oracle 和 PostgreSQL MA, WE v 不 需要 调用 CAST 国 数 。 转 换 
为 CHAR 类 型 时 尤其 要 注意 ， 因 为 CHAR 的 长 度 是 固定 的 长度 不 足 的 部 分 会 被 填充 上 )。 如 
果 确 实 需要 转换 类 型 ， 那 么 就 转 成 VARCHAR 或 VARCHAR2 类 型 。 















































1 select data 

2 from V 

3 where translate(lower(data), 

4 '0123456789abcdefghi jklmnopqrstuvwxyz', 

5 rpad('a',36,'a')) = rpad('a',length(data),'a') 


SQL Server 
因为 SQL Server 不 支持 TRANSLATE 函数 ， 我 们 必须 遍历 每 一 行 数据 ， 并 找 出 那些 包含 非 字 
母 数 字 字 符 的 行 。 有 很 多 种 办 法 可 以 实现 这 一 点 ， 下 面 的 解决 方案 的 思路 是 评估 每 个 字符 
的 ASCII fü, 





























1 select data 

2 from ( 

3 select v.data, iter.pos, 

4 substring(v.data,iter.pos,1) c, 

5 ascii(substring(v.data,iter.pos,1)) val 





6 from v, 
7 ( select id as pos from t100 ) iter 
8 where iter.pos <= len(v.data) 
9 ) x 
10 group by data 
11 having min(val) between 48 and 122 
3. 讨论 


上 述 解 决 方案 的 关键 在 于 能 同时 查看 多 个 字符 。 通 过 使 用 TRANSLATE 函数 ， 我 们 可 以 很 容 
易 处 理 全 部 数字 或 全 部 字符 ， 而 且 不 需要 循环 枚 举 并 逐一 查看 每 个 字符 。 

DB2, Oracle 和 PostgreSQL 

视图 v 的 14 行 数 据 里 只 有 9 行 是 字母 字符 和 数字 字符 。 为 了 筛选 出 只 包含 字母 字符 和 数 
字 字 符 的 行 ， 直 接 使 用 TRANSLATE 国 数 即 可 。 在 本 例 中 ，TRANSLATE 函数 把 字符 0 ~ 
9 和 a ~ z 都 转换 成 了 a。 一 旦 完成 了 这 一 转换 ， 下 一 步 就 要 比较 转换 后 的 行 数据 和 一 个 
(与 当前 行 的 数据 ) 具有 相同 长 度 并 且 只 包括 a 的 字符 串 。 如 果 二 者 相同 ， 那 么 我 们 就 可 
以 认定 该 字符 串 仅 由 字母 和 数字 构成 ， 而 且 不 含 其 他 字符 。 

使 用 TRANSLATE 函数 (这 里 以 Oracle 语法 为 例 )。 


where translate(lower(data), 
'0123456789abcdefghijklmnopqrstuvwxyz', 
rpad('a',36,'a')) 
我 们 把 全 部 数字 和 字母 字符 都 替换 成 了 一 个 独特 的 字符 (我 这 里 选择 了 a)。 一 旦 这 种 替换 
完成 ， 那 些 仅 由 字母 和 数字 组 成 的 字符 串 就 变 成 了 一 个 由 单一 字符 〈 本 例 中 是 a) 构成 的 
字符 串 。 这 一 点 可 以 通过 单独 执行 TRANSLATE 函数 来 进行 验证 。 
select data, translate(lower(data), 


'0123456789abcdefghijklmnopqrstuvwxyz', 
rpad('a',36,'a')) 
































from V 
DATA TRANSLATE(LOWER(DATA) 
NK ren o HANE 
SMITH, $800.00 aaaaa, $aaa.aa 
ALLEN3O aaaaaaa 


虽然 字母 字符 和 数字 字符 被 替换 掉 了 ， 但 字符 串 的 长 度 并 没有 发 生变 化 。 由 于 长 度 是 一 
样 的 ， 被 筛选 出 来 的 行 就 是 那些 调用 了 TRANSLATE 图 数 之 后 返回 值 里 只 包括 a 的 行 。 通 
过 比较 原 字 符 串 的 长 度 和 只 包含 a 的 字符 串 长 度 ， 我 们 保留 了 相等 的 行 ， 过 滤 掉 了 其 他 
的 行 。 
select data, translate(lower(data), 
'0123456789abcdefghijklmnopqrstuvwxyz', 


rpad('a',36,'a')) translated, 
rpad('a',length(data),'a') fixed 
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TRANSLATED 


SMITH, $800.00 


ALLEN30 


最 后 一 步 就 是 只 保留 那些 TRANSLATED 和 FIXED 相等 的 字符 上 


MySQL 
WHERE 子 句 里 的 表达 式 如 下 所 示 : 


where data regexp 


述 条 件 使 得 那些 仅 包 含 数字 和 字母 的 行 会 被 科 选 日 





aaaaa, Saaa.aa 


aaaaaaa 


aaaaaaaaaaaaaa 


aaaaaaa 


'[^0-9a-zA-Z]' = 


















































H 

















8 来 。 方 括号 里 的 取 值 范围 0-9a-zA-z 


: “执行 非 数 


返回 。C 列 的 值 代表 


SEM ia d 符号 ^ 表 示 否 定 ， 因 而 该 表达 式 可 被 解释 为 “ 非 数字 或 
非 字母 "。 返 回 值 等 于 1 代表 TRUE，0 代表 FALSE， 因 此 整个 表达 式 的 意思 是 
字 和 字母 字符 匹配 操作 ， 并 返回 结果 等 于 FALSE 的 行 。 
SQL Server 
首先 遍历 视图 V 的 每 一 行 数据 ，DATA 列 的 每 一 个 字符 都 会 被 作为 一 
了 构成 DATA 值 的 每 一 个 字符 。 
I +------ +------ +------ + 
| data | pos |c | val | 
+----------------- +------ +------ +------ + 
| ADAMS, $1100.00 | 1 | A | 65 | 
| ADAMS, $1100.00 | 2| D | 68 | 
| ADAMS, $1100.00 | 3 | A | 65] 
| ADAMS, $1100.00 | 4 | M | 77| 
| ADAMS, $1100.00 | 5|S | 83 | 
| ADAMS, $1100.00 | 6 | ， | 44 | 
| ADAMS, $1100.00 | 7 | | a2] 
| ADAMS, $1100.00 | 8 | Š | 36] 
| ADAMS, $1100.00 | 9 | 1 | 49 | 
| ADAMS, $1100.00 | 10 | 1 | 49] 
| ADAMS, $1100.00 | 11] 0 | 48 | 
| ADAMS, $1100.00 | 12 | 0 | 48 | 
| ADAMS, $1100.00 | 13 |. | 46 | 
| ADAMS, $1100.00 | 14 | 0 | 48 | 
| ADAMS, $1100.00 | 15 | 0 | 48 | 
ARIILE X 不 仅 会 逐 行 返 回 DATA 列 的 每 一 个 字符 ， 还 会 提供 每 个 字符 的 ASCII 值 。 


SQL Server 的 专 有 功能 ，ASCII 取 值 范围 48 ~ 122 人 


一 点 ， 我 们 就 可 以 对 DATA 进行 分 组 ， 并 过 滤 掉 ASCII 值 不 在 48 ~ 122 范 目 
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6.7 ”提取 姓名 的 首 字母 


1. 问题 
你 想 把 姓名 变 成 首 字母 的 形式 ， 考 虑 人 名 Stewie Griffin， 你 希望 得 到 S.G.. 
2. 解决 方案 





注意 ，SQL 的 灵活 性 比 不 上 C 语言 或 Python 这 样 的 编程 语言 。 因 此 ， 很 难 














使 月 








H SQL 创建 


一 个 处 理 姓名 格式 转换 的 通用 解决 方案 。 下 面 给 出 的 解决 方案 仅 适 用 于 两 种 格式 : 要 么 是 
First Name 和 Last Name 的 组 合 ， 要 么 是 First Name, Middle Name (全 称 或 者 首 字 母 均 可 ) 





和 Last Name 的 组 合 。 


DB2 
使 用 内 置 函数 REPLACE, TRANSLATE 和 REPEAT 提取 首 字母 。 


1 select replace( 

2 replace( 

3 translate(replace('Stewie Griffin', '.', ''), 
4 repeat('4',26), 

5 'abcdefghijklmnopqrstuvwxyz'), 
6 

7 

8 


MySQL 


使 用 内 置 国 数 CONCAT, CONCAT WS, SUBSTRING 和 SUBSTRING INDEX 提取 首 字 母 。 





1 select case 
2 when cnt = 2 then 
3 trim(trailing '.' from 
4 concat ws('.', 
5 substr(substring index(name,' ',1),1,1), 
6 substr(name, 
7 length(substring index(name,' ',1))42,1), 
8 substr(substring index(name,' ',-1),1,1), 
9 "9 
10 else 
11 trim(trailing '.' from 
12 concat ws('.', 
13 substr(substring index(name,' ',1),1,1), 
14 substr(substring index(name,' ',-1),1,1) 
15 )) 
16 end as initials 
17 from ( 
18 select name,length(name)-length(replace(name,' ','')) as cnt 
19 from ( 
20 select replace('Stewie Griffin','.','') as name from t1 
21 )y 
22 )x 

Oracle 和 PostgreSQL 


使 用 内 置 函数 REPLACE, TRANSLATE 和 RPAD 提取 首 字 母 。 
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1 select replace( 

2 replace( 

3 translate(replace('Stewie Griffin', '.', ''), 

4 'abcdefghijklmnoparstuvwxyz', 

5 rpad('4',26,' 4£') ), '&t','' ),' ','.! ) |I." 
6 from t1 


SQL Server 
在 写作 本 书 时 ，SQL Server 尚 不 支持 TRANSLATE 函数 和 CONCAT. WS 函数 。 


3. 讨 论 





通过 分 离 出 大 写字 母 ， 我 们 就 能 从 姓名 中 提取 首 字 母 。 下 面 详细 解释 针对 各 种 数据 库 的 解 

















决 方案 。 
DB2 


REPLACE 函数 会 删除 姓名 里 出 现 的 英文 句号 〈 因 为 有 时 候 Middle Name 会 以 首 字母 形式 表 





IR), Ti TRANSLATE 函数 会 把 非 大 写字 母 都 栖 换 为 字符 #。 


select translate(replace('Stewie Griffin', '.', ''), 
repeat('£',26), 
'abcdefghijklmnopqrstuvwxyz') 





from t1 


TRANSLATE('STE 


SIHHHEL: GIHEHHEE 








此 时 ， 除 了 首 字母 外 ， 名 字 的 其 他 部 分 都 变 成 了 #。 然 后 使 用 REPLACE 函数 删除 所 有 的 #。 


select replace( 
translate(replace('Stewie Griffin', '.', ''), 
repeat('£',26), 
'abcdefghijklmnopqrstuvwxyz'), '£' ,'') 
from t1 


REP 
T 
再 次 使 用 REPLACE 国 数 把 空格 替换 为 英文 句号 。 
select replace( 
replace( 


translate(replace('Stewie Griffin', '.', ''), 
repeat('4',26), 


'abcdefghijklmnopqrstuvwxyz') , ' ,'),' ','.') |] '-." 


from t1 











Oracle 和 PostgreSQL 
REPLACE 函数 会 删除 姓名 里 出 现 的 英文 句号 〈 因 为 有 时 候 Midde Name 会 以 首 字母 形式 表 
示 )， 而 TRANSLATE 函数 会 把 非 大 写字 母 都 替换 为 字符 #。 

select translate(replace('Stewie Griffin','.',''), 


'abcdefghijklmnopqrstuvwxyz', 
rpad('#',26,'#')) 














from t1 


TRANSLATE( ' STE 


SHHHHH GHHHHHH 





此 时 ， 除 了 首 字母 外 ， 姓 名 的 其 他 部 分 都 变 成 了 #。 然 后 使 用 REPLACE 函数 删除 掉 所 有 的 #。 


select repLace( 
translate(replace('Stewie Griffin','.',''), 
'abcdefghijklmnopqrstuvwxyz', 
rpad('#',26,'#')),'#','') 





from t1 
REP 
T 
再 次 使 用 REPLACE ARGE ERRARE =, 
select repLace( 
replace( 


translate(replace('Stewie Griffin','.',''), 
'abcdefghijklmnopqrstuvwxyz', 





rpad('',26,'4') ),'$',''),' ','.!) [| '."' 
from t1 
REPLA 
S.G 
最 后 ， 在 姓名 首 字母 的 末尾 添加 英文 句号 。 
MySQL 














ARAILE Y 用 于 删除 姓名 中 出 现 的 英文 句号 。 内 舱 视 图 x 可 以 找 出 姓名 中 空格 符 的 个 数 ， 
以 便 调用 适当 次 数 的 SUBSTR 函数 来 提取 首 字母 。 先 后 三 次 调用 SUBSTRING INDEX 国 数 ， 根 
据 空格 的 位 置 把 字符 串 拆 成 三 个 单独 的 部 分 。 本 例 中 出 现 的 姓名 只 包括 First Name 和 Last 
Name, CASE 语句 的 ELSE 部 分 代码 会 被 执行 。 

select substr(substring index(name, ' ',1),1,1) as a, 


substr(substring index(name,' ',-1),1,1) as b 
from (select 'Stewie Griffin' as name from t1) x 























AB 


9 0 
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如 果 问 题 中 的 姓名 包含 Middle Name xd EE], MAHITA 











[的 代码 可 以 得 到 首 字 母 。 








substr(name,length(substring index(name, ' ',1))+2,1) 


上 面 的 查询 先 找 出 First Name 的 结束 位 置 ， 并 前 进 两 个 字符 位 置 移动 到 Middle Name jx 












































其 首 字 母 的 开始 位 置 ， 计 算 结果 将 作为 SUBST 函数 的 开始 位 置 。 因 为 只 需要 保留 第 一 








字符 ， 所 以 Middle Name 或 其 首 字母 能 被 成 功 地 返回 。 WE uni. 0 cid 
CONCAT WS 函数 ， 这 样 就 能 用 英文 句号 分 割 各 个 首 字母 。 
select concat ws('.', 
substr(substring index(name, ' ',1),1,1), 
substr(substring index(name,' ',-1),1,1), 
uu oua 
from (select 'Stewie Griffin' as name from t1) x 
A 
S.G.. 


最 后 ， 删 除 首 字母 中 无 关 的 英文 句号 。 


6.8 按照 子 字符 串 排 序 


1. 问题 
你 想 根据 一 个 子 字符 串 对 结果 集 进 行 排序 ， 考 虑 下 面 的 记录 。 














MILLER 


你 希望 按照 每 个 名 字 的 最 后 两 个 字符 对 上 述 记 录 进 行 排序 。 





BLAKE 
ADAMS 
KING 
WARD 
FORD 
CLARK 
SMITH 
SCOTT 


2. 解决 方案 
解决 这 个 问题 的 关键 在 于 使 用 数据 库 管 理 系 统 的 内 置 函数 提取 出 用 作 排 序 标准 的 子 字符 
串 ， 通 常 使 用 SUBSTR 函数 来 实现 这 一 点 。 
DB2. Oracle. MySQL 和 PostgreSQL 
使 用 内 置 函数 LENGTH 和 SUBSTR， 根 据 字符 串 的 特定 部 分 排序 。 
1 select ename 


2 from emp 
3 order by substr(ename,length(ename)-1,2) 








SQL Server 
使 用 SUBSTRING 函数 和 LEN 函数 ， 根 据 子 字符 串 的 特定 部 分 排序 。 


1 select ename 
2 from emp 
3 order by substring(ename,len(ename)-1,2) 


3. 讨论 
通过 在 ORDER BY 子 句 里 使 用 SUBSTR 表达 式 ， 我 们 可 以 选择 一 个 字符 串 的 任意 部 分 用 于 结 
果 集 的 排序 。 其 实 ， 也 可 以 不 使 用 SuBSTR 函数 ， 我 们 可 以 基于 任何 表达 式 对 结果 集 排序 。 


69 ”根据 字符 串 里 的 数字 排序 


1. 问题 
你 希望 根据 字符 串 里 的 数字 对 结果 集 进 行 排序 ， 考 虑 下 面 的 视图 。 


create view V as 
select e.ename ||' '|| 
cast(e.empno as char(4))||' '|| 
d.dname as data 
from emp e, dept d 
where e.deptno=d.deptno 


下 面 是 上 述 视 图 返回 的 数据 。 
































7 














CLARK 7782 ACCOUNTING 
KING 7839 ACCOUNTING 
MILLER 7934 ACCOUNTING 
SMITH 7369 RESEARCH 
JONES 7566 RESEARCH 
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SCOTT 7788 RESEARCH 
ADAMS 7876 RESEARCH 
FORD 7902 RESEARCH 
ALLEN 7499 SALES 
WARD 7521 SALES 
MARTIN 7654 SALES 
BLAKE 7698 SALES 
TURNER 7844 SALES 
JAMES 7900 SALES 

以 上 数据 包括 员工 名 字 、 

该 数据 进行 排序 。 
DATA 
SMITH 7369 RESEARCH 
ALLEN 7499 SALES 
WARD 7521 SALES 
JONES 7566 RESEARCH 
MARTIN 7654 SALES 
BLAKE 7698 SALES 
CLARK 7782 ACCOUNTING 
SCOTT 7788 RESEARCH 
KING 7839 ACCOUNTING 
TURNER 7844 SALES 
ADAMS 7876 RESEARCH 
JAMES 7900 SALES 
FORD 7902 RESEARCH 
MILLER 7934 ACCOUNTING 

2. 解决 方案 


员工 编号 和 部 门 名 称 三 部 分 数据 ， 你 希望 按照 中 间 的 员工 编号 对 





下 面 的 每 一 种 解决 方案 都 使 用 了 各 个 数据 库 特 有 的 函数 和 语法 ， 但 方法 (利用 内 置 函 数 
REPLACE 和 TRANSLATE) 却 是 相同 的 。 基 本 思路 都 是 使 用 REPLACE 和 TRANSLATE 国 数 删 除 字 





符 申 里 的 非 数字 字 
DB2 





符 ， 只 留 下 用 于 排序 的 数字 。 


使 用 内 置 函数 REPLACE 和 TRANSLATE 提取 字符 串 里 的 数 


1 select data 
2 from V 

3 order by 

4 cas 
5 replac 
6 translat 
7 replac 
8 translat 
9 


Oracle 





t( 

e( 

e(data,repeat('s',length(data)), 

e( 

e(data, HEHHBHHHHBE 0123456789! ), 
'#','')),'#','') as integer) 


使 用 内 置 函数 REPLACE 和 TRANSLATE 提取 字符 串 里 的 数 


1 select data 
2 from V 





按照 数字 排序 。 





按照 数字 排序 。 
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3 order by 

4 to number( 

5 replace( 

6 translate(data, 

7 replace( 

8 translate(data,'0123456789' , HHHHHHHHHE ) , 

9 '#'),rpad('#',20,'#')),'#')) 
PostgreSQL 
使 用 内 置 函数 REPLACE 和 TRANSLATE 提取 字符 串 里 的 数字 ， 并 按照 数字 排序 。 

1 select data 

2 from V 

3 order by 

4 cast( 

5 replace( 

6 translate(data, 

7 replace( 

8 translate(data,'0123456789' , IHHHHHBHHBE') , 

9 '#',''),rpad('#',20,'#')),'#','') as integer) 
MySQL 和 SQL Server 
在 写作 本 书 时 ， 这 两 种 数据 库 尚 不 支持 TRANSLATE 函数 。 
3. 讨论 








视图 v 只 是 为 了 提供 演示 本 实例 解决 方案 的 数据 。 该 视图 只 是 简单 地 把 EMP 表 的 一 些 列 串 
联 起 来 。 上 述 解 决 方案 展示 了 如 何以 串联 后 的 文本 作为 输入 数据 ， 并 按照 误 入 其 中 的 员工 
号 进行 排序 。 

各 个 解决 方案 的 ORDER BY 子 句 虽 然 看 起 来 有 点 吓人 ， 但 效果 不 错 。 如 果 我 们 一 段 一 段 地 仔 
细 阅 读 的 话 ， 就 会 发 现 它 其 实 不 难 理解 。 为 了 按照 字符 串 里 的 数字 排序 ， 最 简单 的 办 法 就 
是 删除 所 有 的 非 数字 字符 。 删 除非 数字 字符 后 ， 把 数字 字符 变 成 数值 类 型 ， 并 进行 排序 。 
在 开始 解释 每 一 次 函数 调用 之 前 ， 我 们 要 先 理解 各 个 函数 被 调用 的 次 序 。 先 从 最 内 层 的 
TRANSLATE 函数 调用 (每 个 解决 方案 的 第 8 行 ) 开始 ， 我 们 可 以 看 到 : 
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(1) TRANSLATE 函数 (35 8 £5) 被 调用 ， 把 执行 结果 传递 给 ， 
(2) REPLACE 函数 (第 7 行 )， 并 把 执行 结果 传递 给 ， 

(3) TRANSLATE 函数 (第 6 行 )， 并 把 执行 结果 传递 给 ， 

(4) REPLACE 函数 (第 5 行 )， 其 执行 结果 被 返回 ， 最后; 
(5) 转换 为 数值 类 型 。 




















第 一 步 是 把 数字 替换 为 一 个 特别 的 字符 ， 它 和 去 掉 数 字 后 字符 串 里 剩 下 的 字符 都 不 相同 。 
本 例 中 我 选择 了 #， 并 使 用 TRANSLATE 函数 把 所 有 的 数字 都 替换 成 #。 人 例如， 下面 的 查询 左 
边 显示 的 是 原来 的 字符 串 ， 右 边 显示 的 是 第 一 次 转换 后 得 到 的 结果 。 

select data, 


translate(data,'0123456789' , '##########'") as tmp 
from V 
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CLARK 7782 ACCOUNTING CLARK #### ACCOUNTING 
KING 7839 ACCOUNTING KING #### ACCOUNTING 
MILLER 7934 ACCOUNTING MILLER #### ACCOUNTING 
SMITH 7369 RESEARCH SMITH HH RESEARCH 
JONES 7566 RESEARCH JONES #### RESEARCH 
SCOTT 7788 RESEARCH SCOTT #### RESEARCH 
ADAMS 7876 RESEARCH ADAMS #### RESEARCH 
FORD 7902 RESEARCH FORD #### RESEARCH 
ALLEN 7499 SALES ALLEN  #### SALES 

WARD 7521 SALES WARD #### SALES 
MARTIN 7654 SALES MARTIN #### SALES 
BLAKE 7698 SALES BLAKE #### SALES 
TURNER 7844 SALES TURNER #### SALES 
JAMES 7900 SALES JAMES — #### SALES 


TRANSLATE 函数 找到 每 个 字符 串 里 的 数字 字符 ， 并 逐一 替换 为 #。 转 换 后 字符 串 被 传递 到 
REPLACE 函数 (第 7 行 )， 它 会 删除 所 有 的 #。 


select data, 





replace( 

translate(data, '0123456789' ,'##########' ) , '#') as tmp 
from V 

DATA TMP 

CLARK 7782 ACCOUNTING CLARK ACCOUNTING 
KING 7839 ACCOUNTING KING ACCOUNTING 
MILLER 7934 ACCOUNTING MILLER ACCOUNTING 
SMITH 7369 RESEARCH SMITH RESEARCH 
JONES 7566 RESEARCH JONES RESEARCH 
SCOTT 7788 RESEARCH SCOTT RESEARCH 
ADAMS 7876 RESEARCH ADAMS RESEARCH 
FORD 7902 RESEARCH FORD RESEARCH 
ALLEN 7499 SALES ALLEN SALES 

WARD 7521 SALES WARD SALES 
MARTIN 7654 SALES MARTIN SALES 
BLAKE 7698 SALES BLAKE SALES 
TURNER 7844 SALES TURNER SALES 
JAMES 7900 SALES JAMES SALES 





然后 ， 上 述 结果 再 一 次 被 传递 给 TRANSLATE 函数 ， 但 这 次 是 本 解决 方案 第 二 次 (最 外 层 ) 
调用 TRANSLATE 函数 。 该 TRANSLATE 函数 在 原来 的 字符 串 中 搜索 和 TMP 相 匹 配 的 字符 。 如 
果 找 到 的 话 ， 就 把 它们 都 奉 换 成 #。 这 一 转换 使 得 所 有 非 数字 字符 能 够 被 当 作 单一 字符 来 
处 理 〈 因 为 它们 都 被 替换 成 了 相同 的 字符 ) 。 
select data, translate(data, 
replace( 
translate(data,'0123456789' , IHHEHHHHHBE') , 
ut), 
rpad('£',length(data), '4')) as tmp 








from V 





CLARK 7782 ACCOUNTING THHHHHHHET T8 HHEHHEHBHHHEBE 
KING 7839 ACCOUNTING THHHHHEHHETS3OTHHHEHHBHHHHSE 
MILLER 7934 ACCOUNTING THHHHHHBHETO 3 MEHHEHHHHHBBE 
SMITH 7369 RESEARCH THHHHHHHET 36 OTHHHEHEHHHE 
JONES 7566 RESEARCH THHHHHHHET 56 OTHEHHEHEHHE 
SCOTT 7788 RESEARCH THHHHHHHET 7 8 STHHHEHEHHHE 
ADAMS 7876 RESEARCH THHHHHEHHETS T OSHEHHEHEHHHE 
FORD 7902 RESEARCH THHHHHEHHETOO DAHHHEIHEHHS 
ALLEN 7499 SALES THHHHHHHET A0 OTHEIHETHE 

WARD 7521 SALES THHHHHHHET 52 MBHHHEHE 
MARTIN 7654 SALES THHHHHHHET 65 MBHBEHE 
BLAKE 7698 SALES THHHHHHHET 69 STHHHEIHE 
TURNER 7844 SALES THHHHHHHET 8 4 MBHHEHE 
JAMES 7900 SALES THHHHHEHHET 900 HEIHETHE 


接 下 来 ， 通 过 调用 REPLACE 函数 (E 5 £3) 删除 所 有 的 #， 只 留 下 数字 字符 。 


select data, replace( 


translate(data, 
replace( 
translate(data,'0123456789' , IHHHHHHHHBHE') , 
'#'), 
rpad('#',length(data),'#')),'#') as tmp 
from V 

DATA TMP 

CLARK 7782 ACCOUNTING 7782 
KING 7839 ACCOUNTING 7839 
MILLER 7934 ACCOUNTING 7934 
SMITH 7369 RESEARCH 7369 
JONES 7566 RESEARCH 7566 
SCOTT 7788 RESEARCH 7788 
ADAMS 7876 RESEARCH 7876 
FORD 7902 RESEARCH 7902 
ALLEN 7499 SALES 7499 
WARD 7521 SALES 7521 
MARTIN 7654 SALES 7654 
BLAKE 7698 SALES 7698 
TURNER 7844 SALES 7844 
JAMES 7900 SALES 7900 





最 后 ， 使 用 数据 库 管理 系统 中 合适 的 函数 (通常 是 CAST) 把 TMP 转换 为 数值 类 型 (第 4 


行 )， 





结果 如 下 所 示 。 


select data, to_number( 
replace( 
translate(data, 
replace( 
translate(data,'0123456789' , IHHEHHHHHHBHE') , 
'#'), 
rpad('#',length(data),'#')),'#')) as tmp 
from V 
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DATA TMP 
CLARK 7782 ACCOUNTING 7782 
KING 7839 ACCOUNTING 7839 
MILLER 7934 ACCOUNTING 7934 
SMITH 7369 RESEARCH 7369 
JONES 7566 RESEARCH 7566 
SCOTT 7788 RESEARCH 7788 
ADAMS 7876 RESEARCH 7876 
FORD 7902 RESEARCH 7902 
ALLEN 7499 SALES 7499 
WARD 7521 SALES 7521 
MARTIN 7654 SALES 7654 
BLAKE 7698 SALES 7698 
TURNER 7844 SALES 7844 
JAMES 7900 SALES 7900 
当 编 写 类 似 这 样 的 查询 语句 时 ， 不 妨 把 写 好 的 表达 式 放 入 SELECT 列表 里 试 着 执行 一 下 ， 
这 会 非常 有 用 。 因 为 我 们 能 很 容易 看 到 中 间 结 果 ， 直 到 得 出 最 终 的 解决 方案 。 然 而 ， 因 
为 本 实例 的 重点 是 对 结果 集 进 行 排序 ， 所 以 最 终 仍 需要 把 所 有 的 函数 调用 都 放 进 ORDER 
BY 子 句 里 。 
select data 
from V 
order by 
to_number( 
replace( 
translate( data, 
replace( 


translate( data,'0123456789' , IHEHHHBHHBHHE ) , 


'#'),rpad('#',length(data),'#')),'#')) 


MARTIN 
BLAKE 
CLARK 
SCOTT 
KING 
TURNER 
ADAMS 
JAMES 
FORD 
MILLER 


7654 
7698 
7782 
7788 
7839 
7844 
7876 
7900 
7902 
7934 


RESEARCH 
SALES 
SALES 
RESEARCH 
SALES 
SALES 
ACCOUNTING 
RESEARCH 
ACCOUNTING 
SALES 
RESEARCH 
SALES 
RESEARCH 
ACCOUNTING 


后 值得 注意 的 是 ， 本 例 的 视图 数据 包含 3 个 字段 ， 其 中 只 








5 HE 


要 将 它们 拼接 成 一 个 数字 ， 然 后 再 排序 。 

















一 个 字段 是 数字 。 如 果 有 多 





6.10 创建 分 隔 列表 


1. 问题 


你 想 


想 把 行 数据 变 成 以 某 种 符号 分 隔 的 列表 ， 例 如 以 和 逗 号 分 隔 ， 而 不 是 常见 的 坚 排 的 列 数 据 








形式 。 你 希望 转换 下 面 的 结果 集 。 


DEPTNO EMPS 


变 成 这 样 : 


10 MILLER 
20 SMITH 
20 ADAMS 
20 FORD 

20 SCOTT 
20 JONES 
30 ALLEN 
30 BLAKE 
30 MARTIN 
30 JAMES 
30 TURNER 
30 WARD 





DEPTNO EMPS 


10 CLARK,KING,MILLER 
20 SMITH, JONES, SCOTT , ADAMS , FORD 
30 ALLEN,WARD , MARTIN,BLAKE , TURNER , JAMES 


2. 解决 方案 


对 于 本 问题 


— 


言 ， 每 一 种 数据 库 的 解决 方案 都 不 同 ， 关 键 在 于 如 何 充 分 利用 数据 库 的 内 置 








函数 。 弄 清楚 数据 库 提 供 了 哪些 函数 ， 我 们 才能 充分 利用 数据 库 的 功能 ， 针 对 那些 传统 上 








SQL 不 擅长 的 问题 探索 出 创造 性 的 解决 方案 。 


DB2 





使 用 WITH 子 名 递归 地 查询 创建 分 隔 列 表 。 


co — OA n + ÜQ) N P 


with 
as 
select 


from 
union 
select 
from 
where 
and 


select 
from 
where 





X (deptno, cnt, list, empno, len) 

( 

deptno, count(*) over (partition by deptno), 
cast(ename as varchar(100)), empno, 1 


emp 
all 

x.deptno, x.cnt, x.list ||','|| e.ename, e.empno, x.len+1 
emp e, x 

e.deptno = x.deptno 


e.empno » x. empno 


) 
deptno,list 
x 

len = cnt 
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MySQL 
使 用 内 置 函 数 GROUP_CONCAT 创建 分 隔 列 表 。 





eptno, 

roup concat(ename order by empno separator, ',') as emps 
mp 

y deptno 


使 用 内 置 国 数 SYS CONNECT. BY. PATH 创建 分 隔 列 表 。 


1 select d 
2 g 
3 from e 
4 group b 
Oracle 
1 select 
2 
3 from 
4 select 
5 
6 
7 
8 
9 
10 from 
11 
12 where 
13 start 
14 connect 
PostgreSQL 


deptno, 
ltrim(sys connect by path(ename,','),',') emps 
( 
deptno, 
ename, 
row number() over 
(partition by deptno order by empno) rn, 
count(*) over 
(partition by deptno) cnt 


emp 
) 

level = cnt 
with rn = 1 


by prior deptno = deptno and prior rn = rn-1 








PostgreSQL 没有 提供 用 于 创建 分 隔 列 表 的 标准 内 置 函数 ， 因 而 需要 提前 知道 列表 里 有 和 多少 
个 元 素 。 知 道 了 最 大 的 列表 长 度 ， 就 能 确定 在 使 用 置换 和 字符 串 拼 接 等 传统 手段 创建 列表 


























时 需要 附加 多 少 个 值 。 
1 select deptno, 
2 rtrim( 
3 max(case when pos-1 then emps else '' end)|| 
4 max(case when pos-2 then emps else '' end)|| 
5 max(case when pos-3 then emps else '' end)|| 
6 max(case when pos-4 then emps else '' end)|| 
7 max(case when pos-5 then emps else '' end)|| 
8 max(case when pos-6 then emps else '' end),',' 
9 ) as emps 
10 from ( 
11 select a.deptno, 
12 a.ename||',' as emps, 
13 d.cnt, 
14 (select count(*) from emp b 
15 where a.deptno-b.deptno and b.empno «- a.empno) as pos 
16 from emp a, 
17 (select deptno, count(ename) as cnt 
18 from emp 
19 group by deptno) d 
20 where d.deptno-a.deptno 
21 )x 
22 group by deptno 
23 order by 1 





SQL Server 
使 用 WITH 子 句 递归 地 查询 创建 分 隔 列 表 。 








1 with x (deptno, cnt, list, empno, len) 

2 as ( 

3 select deptno, count(*) over (partition by deptno), 
4 cast(ename as varchar(100)), 

5 empno, 

6 1 

7 from emp 

8 union all 

9 select x.deptno, x.cnt, 

10 cast(x.list + ',' + e.ename as varchar(100)), 
11 e.empno, x.len+1 

12 from emp e, x 

13 where e.deptno = x.deptno 

14 and e.empno » x. empno 

15 ) 

16 select deptno,list 

17 from x 

18 where len - cnt 

19 order by 1 


3. 讨论 

用 SQL 创建 分 隔 列 表 之 所 以 有 用 ， 是 因为 它 是 一 个 常见 任务 。 然 而 ， 每 种 数据 库 的 做 法 
却 各 不 相同 。 甚 至 ， 不 同 数据 库 的 解决 方案 之 间 几 乎 没有 相同 之 处 。 从 使 用 递归 、 分 层 国 
数 、 经 典 的 类 型 转换 到 数据 聚合 ， 各 个 数据 库 的 做 法 近 异 。 

DB2 和 SQL Server 

这 两 种 数据 库 的 解决 方案 仅 在 语法 上 略 有 不 同 (DB2 的 字符 串 连 接 运 算 符 是 ||, SQL 
Server 则 是 +) ， 具 体 做 法 完全 相同 。WMITH 子 句 的 第 一 个 查询 (UNION ALL 的 前 半 部 分 ) 返 
回 每 位 员工 的 下 列 信息 : 部 门 、 员 工 编号 、 名 字 、ID 和 常量 1 (在 这 里 ,该 常量 没有 任何 
作用 )。 弟 归 处 理发 生 在 第 二 个 查询 (UNION ALL 的 后 半 部 分 ) ， 并 生成 分 隔 列表 。 为 了 理解 
分 隔 列表 的 生成 过 程 ， 我 们 来 仔细 观察 该 解决 方案 的 一 些 代 码 片段 。 首 先是 UNION ALL 的 
第 二 个 查询 的 SELECT 列表 的 第 三 项 。 


x.list ||','|| e.ename 


然后 是 该 查询 的 WHERE 子 句 。 


where e.deptno = x.deptno 
and e.empno > x.empno 


本 解决 方案 首先 确保 员工 是 同一 个 部 门 的 。 然 后 ， 对 于 UNION ALL 的 第 一 个 查询 返回 的 每 
一 个 员工 ， 只 要 员工 编号 比 自己 大 ， 就 把 名 字 附 加 在 分 隔 列 表 的 最 后 。 这 样 就 能 确保 不 会 
把 自己 的 名 字 附 加 到 最 后 。 表 达 式 : 


x.len+1 


在 每 次 一 个 员工 被 评估 过 之 后 为 [EN (从 1 开始 ) 加 上 1, 2 o 
总 数 ， 我 们 就 知道 全 部 员工 都 被 评估 过 了 ， 分 隔 列 表 也 就 创建 完成 了 。 这 是 关键 所 在 ， 
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不 仅 标志 着 分 隔 列 表 创 建 完成 ， 也 能 及 时 终止 递归 处 理 。 


where len = cnt 





MySQL 
GROUP_CONCAT 函数 可 以 完成 所 有 的 工作 。 它 负责 把 传递 给 它 的 ENAME 列 拼接 起 来 。GROUP_ 
CONCAT 函数 是 一 个 聚合 国 数 ， 因 而 查询 语句 里 需要 用 到 GROUP BY, 


Oracle 

里 解 Oracle 解决 方案 的 第 一 步 是 把 它 拆 开 来 看 。 执 行内 嵌 视 图 (第 4 ~ 10 行 )， 生 成 的 结 
果 集 包括 每 位 员工 的 下 列 信息 : 部 门 、 名 字 ， 按 照 EMPNO 升序 排列 得 出 的 每 位 员工 在 各 自 
部 门 的 排名 ,以 及 本 部 门 的 员工 总 数 。 例 如 : 


select deptno, 
ename， 
row_number() over 
(partition by deptno order by empno) rn, 
count(*) over (partition by deptno) cnt 























MH 




















from emp 
DEPTNO ENAME RN CNT 
10 CLARK f 3 
10 KING 2 3 
10 MILLER 3 3 
20 SMITH 1 5 
20 JONES 2 5 
20 SCOTT 3 5 
20 ADAMS 4 5 
20 FORD 5 5 
30 ALLEN 1 6 
30 WARD 2 6 
30 MARTIN 3 6 
30 BLAKE 4 6 
30 TURNER 5 6 
30 JAMES 6 6 


排名 (上 述 查 询 里 别名 为 RN) 是 为 了 方便 遍历 整 棵 树 。 由 于 ROW. NUMBER 生成 从 1 开始 的 
连续 数字 序列 ， 不 会 有 重复 数字 ， 也 不 会 有 空 阶 ， 因 此 如 果 想 参照 前 一 行 (或 者 父 市 点 )， 
只 需要 (把 当前 的 RN 值 ) 减 1 即 可 。 例 如 ，3 前 面 的 数字 是 3 减 去 1， 结 果 是 2。 在 这 
里 ，2 是 3 的 父 节 点 ， 可 以 通过 第 12 行 观察 到 这 一 点 。 除 此 之 外 ， 下 面 的 两 行 代码 ; 
start with rn = 1 
connect by prior deptno = deptno 


指明 RN 等 于 1 的 节点 即 为 每 个 DEPTNO 的 根 节点 ， 并 为 (RN 等 于 1 的 记录 出 现时 ) 每 一 个 
新 出 现 的 部 门 创建 一 个 单独 的 列表 。 

这 时 ， 我 们 应 该 停 下 来 ， 再 看 一 下 ROW NUMBER 函数 的 ORDER BY 部 分 。 请 记 住 ， 员 工 名 字 会 
按照 EMPNO 排名 ， 列 表 也 按照 EMPNO 的 顺序 生成 。 每 个 部 门 的 员工 总 数 会 被 计算 出 来 ( 别 
名 为 CNT)， 并 用 于 确保 只 有 那些 包含 部 门 内 全 体 员工 的 列表 才 会 被 返回 。 之 所 以 要 这 样 
























































做 ， 是 因为 SYS_CONNECT_BY_PATH 会 循环 生成 列表 ， 而 我 们 也 不 希望 得 到 不 完整 的 列表 。 


对 于 层次 查询 ， 伪 列 LEVEL 从 1 开始 (对 于 不 使 用 CONNECT BY 的 查询 ，LEVEL 是 0。 但 在 
OracleDatabase 10g 数据 库 及 后 续 版 本 里 ，LEVEL 必须 和 CONNECT BY 同时 出 现 ) ， 每 当 部 门 
里 的 一 个 员工 被 评估 〈 即 层次 遍历 每 深入 一 层 ) 后 ，LEVEL 会 加 1。 因 此 ， 当 LEVEL 和 CNT 
相等 的 时 候 ， 我 们 就 知道 循环 走 到 了 最 后 一 个 EMPN0， 这 时 就 产生 了 一 个 完整 的 列表 。 


o 

















SVS. CONVECT. BY. PATH 函数 会 在 列表 的 前 面 也 加 上 一 个 事先 选 定 的 分 隔 符 (本 
p^ 。 例 中 是 逗号 )。 有 时 这 不 符合 我 们 的 预期 。 本 实例 的 解决 方案 里 ， 我 们 调用 
t LTRIM 函数 删除 了 列表 开头 的 逗号 。 























PostgreSQL 

PostgreSQL 解决 方案 要 求 事先 知道 所 有 部 门 里 员工 总 数 的 最 大 值 。 执 行内 藤 视 图 (第 11 — 
18 行 ) 生成 的 结果 集 包 括 (每 位 员工 的 ) 部 门 、 后 面 附 加 了 逗号 的 名 字 、 所 属 部 门 的 员工 
总 数 以 及 EMPN0 比 他 小 的 员工 总 数 。 








deptno | emps | cnt | pos 
-------- +---------+-----+----- 
20 | SMITH, | 5| 1 
30 | ALLEN, | 6 | 1 
30 | WARD | 6] 2 
20 | JONES, | 5| 2 
30 | MARTIN, | 6 | 3 
30| BLAKE, | 6| 4 
10 | CLARK, | 3| 1 
20 | SCOTT, | 5| 3 
10 | KING, | 3| 2 
30 | TURNER, | 6| 5 
20 | ADAMS, | 5| 4 
30 | JAMES, | 6| 6 
20 | FORD, | 5| 5 
10 | MILLER, | 3| 3 


产生 Pos 列 的 标量 子 查询 (第 14 ~ 15 fT) 用 于 按照 EMPNO 来 排列 每 一 个 员工 。 例 如 ， 下 
面 这 行 代码 。 

max(case when pos = 1 then emps else '' end)|| 
上 述 代 码 评估 POS 是 否 等 于 1。 如果 POS 等 于 1，CASE 表达 式 将 返回 员工 名 字 ， 反 之 则 返 
回 Null。 
我 们 必须 先 查询 整个 表 的 数据 ， 搞 清楚 一 个 列表 里 最 多 可 能 出 现 几 个 值 。 对 于 EMP 表 的 数 
据 而 言 ， 一 个 部 门 里 最 多 有 6 个 人 ， 因 此 一 个 列表 里 最 多 会 出 现 6 项 。 
下 一 步 就 是 开始 创建 列表 。 我 们 在 内 几 视 图 返回 的 行 数据 之 上 (以 CASE 表达 式 的 形式 ) 执 
行 一 些 条 件 逻 辑 运算 来 做 到 这 一 点 。 
列表 里 可 能 出 现 多 个 值 ， 我 们 就 必须 写 多 个 CASE 表达 式 。 
如 果 Pos 等 于 1， 当 前 的 名 字 会 被 加 入 列表 。 第 二 个 CASE 表达 式 评估 POS 是 否 等 于 2， 如 果 
是 ， 则 第 二 个 名 字 会 被 附加 在 第 一 个 后 面 。 如 果 没 有 第 二 个 名 字 ， 则 会 有 一 个 额外 的 逗号 附 
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加 在 第 一 个 名 字 后 面 (对 于 每 一 个 不 同 的 Pos 值 ， 该 处 理 都 会 重复 一 次 ， 直 至 最 后 一 个 ) 。 

这 里 的 MAX 函数 调用 不 可 省 略 ， 因 为 每 个 部 门 只 需要 生成 一 个 列表 (也 可 以 调用 MIN 函数 。 
本 例 中 两 者 没有 分 别 ， 因 为 对 于 每 一 个 CASE 条 件 运算 ，P0Ss 只 返回 一 个 值 )。 无 论 何 时 调 
用 了 聚合 函数 ，SELECT 列表 里 不 涉及 聚合 运算 的 项 目 必 须 出 现在 GROUP. BY 子 句 里 。 这 一 点 
确保 了 每 个 SELECT 列表 里 不 涉及 聚合 运算 的 项 目 只 会 出 现 一 行 。 


注意 ， 我 们 需要 RTRIM 函数 来 删除 末尾 的 逗号 ， 喜 号 的 数目 总 是 等 于 列表 里 可 能 出 现 的 值 
的 最 大 个 数 (本 例 中 为 6) 。 


6.11 分 隔 数据 转换 为 多 值 IN 列表 


1. 问题 
你 有 一 些 分 隔 数据 ， 想 传递 给 WHERE 子 句 的 IN 列表 。 考 虑 下 面 的 字符 串 。 


7654,7698,7782,7788 


你 希望 在 WHERE 子 句 里 使 用 上 述 字符 串 ， 但 是 下 面 的 SQL 会 由 于 EMPNO 列 是 数值 字段 而 
执行 失败 。 
select ename,sal,deptno 


from emp 
where empno in ( '7654,7698,7782,7788' ) 


EIR SQL 之 所 以 失败 是 因为 ，EMPN0 列 是 数值 类 型 ， 而 IN 列表 里 却 上 只 有 一 个 字符 串 。 
希望 上 述 字符 串 能 被 当 作 喜 号 分 隔 的 数值 列表 。 

2. 解决 方案 

从 表面 上 看 ， 我 们 应 该 设法 让 SQL 把 分 隔 字符 串 当成 一 系列 用 过 号 分 隔 好 的 值 。 然 而 ， 习 
实 并 非 如 此 。 如 果 一 个 有 逗号 出 现在 引号 里 ，SQL 无 法 知道 它 是 一 个 多 值 列 表 。SQL 会 把 引 
号 中 的 任何 值 当 成 单一 的 字符 串 数据 。 我 们 必须 把 该 字符 串 打 散 ， 变 成 单个 的 EMPN0。 本 
解决 方案 的 关键 之 处 在 于 遍历 字符 串 ， 但 是 并 不 需要 深入 到 每 一 个 字符 。 只 需要 遍历 字符 
串 中 每 一 个 有 效 的 EMPN0 即 可 。 

DB2 

遍历 传递 给 IN 列表 的 字符 串 ， 我 们 很 容易 将 其 转换 为 行 数据 。 在 这 里 ， 国 数 ROW. NUMBER, 
LOCATE 和 SUBSTR 非常 有 用 。 
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1 select empno,ename,sal,deptno 

2 from emp 

3 where empno in ( 

4 select cast(substr(c,2,locate(',',c,2)-2) as integer) empno 
5 from ( 

6 select substr(csv.emps,cast(iter.pos as integer)) as c 

7 from (select ','||'7654,7698,7782,7788' || ',' emps 

8 from t1) csv, 

9 (select id as pos 
0 from t100 ) iter 
1 where iter.pos <= length(csv.emps) 





) x 


13 where length(c) > 1 


14 and substr(c,1,1) = ',' 
15 ) y 
MySQL 











遍历 传递 给 IN 列表 的 字符 串 ， 我 们 很 容易 将 其 转换 为 行 数据 。 


1 select 
2 from 
3 where 
4 

5 select 
6 

6 from 
7 
8 
9 


where 
10 
11 


Oracle 


遍历 传递 给 IN 列表 的 字符 串 ， 我 们 很 容易 将 其 转换 为 行 数据 。 在 这 里 ，ROWNUM、 





empno, ename, sal, deptno 
emp 
empno in 
( 
substring index( 
substring index(list.vals,',',iter.pos),',',-1) empno 
(select id pos from t10) as iter, 
(select '7654,7698,7782,7788' as vals 
from t1) list 
iter.pos «- 
(length(list.vals)-length(replace(list.vals,',','')))«1 
) x 


INSTR 非常 有 用 。 


select 
from 
where 


1 
2 
3 
4 
5 
6 
7 
8 


9 
10 
11 
12 
13 
14 ) 


PostgreSQL 


empno,ename,sal,deptno 

emp 

empno in ( 

select to number( 
rtrim( 
substr(emps, 
instr(emps,',',1,iter.pos)-41, 
instr(emps,',',1,iter.pos*1) - 
instr(emps,',',1,iter.pos)),',')) emps 


SUBSTR 和 


from (select ','||'7654,7698,7782,7788'||',' emps from t1) csv, 


(select rownum pos from emp) iter 
where iter.pos «- ((length(csv.emps)- 
length(replace(csv.emps,', ')))/length(', '))-1 


遍历 传递 给 IN 列表 的 字符 串 ， 我 们 很 容易 将 其 转换 为 行 数据 。SPLIT_PART 函数 能 方便 地 
把 字符 串 解 析 成 多 个 单独 的 数字 。 


1 select 
2 from 
3 where 
4 select 
5 from 
6 select 
7 from 
8 

9 

0 


res 


where 


ename,sal,deptno 

emp 

empno in ( 

cast(empno as integer) as empno 

( 

split_part(list.vals,',',iter.pos) as empno 

(select id as pos from t10) iter, 

(select ','||'7654,7698,7782,7788'||',' as vals 
from t1) list 

iter.pos <= 
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11 length(list.vals)-length(replace(list.vals,',','')) 


12 ) z 
13 where length(empno) > 0 
14 ) x 

SQL Server 


遍历 传递 给 IN 列表 的 字符 串 ， 我 们 很 容易 将 其 转换 为 行 数据 。 在 这 里 ， 国 数 ROW_NUMBER. 
CHARINDEX 和 SUBSTRING dE H, 


1 select empno,ename,sal,deptno 

2 from emp 

3 where empno in (select substring(c,2,charindex(',',c,2)-2) as empno 
4 from ( 

5 select substring(csv.emps,iter.pos,len(csv.emps)) as c 

6 from (select ','4'7654,7698,7782,7788'*' ,' as emps 

7 from t1) csv, 

8 (select id as pos 


9 from t100) iter 
10 where iter.pos «- len(csv.emps) 
11 ) x 


12 where len(c) » 1 
13 and substring(c,1,1) = ',' 
14 ) y 


3. 讨论 
这 个 解决 方案 的 第 一 步 就 是 遍历 字符 串 ， 这 也 是 最 重要 的 一 步 。 一 旦 你 完成 了 这 一 步 ， 那 
么 剩 下 的 就 是 解析 字符 串 ， 用 数据 库 提 供 的 函数 把 字符 串 逐 个 转换 为 数值 。 


DB2 和 SQL Server 
Wal X (第 6 ~ 11 行 ) 遍历 字符 串 。 该 解决 方案 的 思路 就 是 遍历 字符 串 ， 因 此 每 一 行 
都 比 它 前 面 的 那 行 少 一 个 字符 。 


,7654,7698,7782,7788 ， 
7654,7698,7782,7788, 
654,7698,7782,7788, 
54,7698,7782,7788, 
4,7698,7782,7788, 
,7698 ,7782,7788 ， 
7698 ,7782,7788 ， 
698,7782,7788, 
98,7782,7788, 
8,7782,7788, 
,7782,7788， 
7782,7788, 

782,7788, 

82,7788, 

2,7788, 

, 7788, 

7788, 

788, 

88, 























注意 ， 字 符 串 前 后 都 有 逗号 〈 分 隔 符 )， 因 此 不 需要 特意 检查 字符 串 的 起 止 位 置 。 


下 一 步 就 是 只 保留 我 们 想 要 放 在 IN 列表 中 的 值 。 这 些 值 都 以 逗号 开头 ， 但 是 要 排除 掉 最 后 
一 行 ， 因 为 最 后 一 行 只 有 一 个 孤零零 的 逗号 。 调 用 图 数 SUBSTR 或 SUBSTRING fiie iH LE = 
开头 的 行 ， 然 后 在 那 一 行 里 找到 下 一 个 逗号 ， 并 留 下 两 个 辟 号 之 间 的 所 有 字符 。 这 一 步 完 
成 后 ， 接 着 要 把 找到 的 字符 串 转 换 为 数字 ， 这 样 就 可 以 针对 数值 类 型 的 EMPNO 列 (第 4 — 
1447) 进行 适当 的 评 佑 。 














最 后 ， 把 结果 集 放 入 一 个 子 查 询 里 ， 并 返回 想 要 得 到 的 行 。 





ARIE (第 5 ~ 9 行 ) 遍历 字符 串 。 第 10 行 的 表达 式 决定 了 字符 串 里 包含 多 少 个 值 ， 
这 是 通过 找 出 字符 串 中 有 多 少 个 辟 号 〈 分 隔 符 ) 并 加 上 1 来 实现 的 。 函 数 SUBSTRING_INDEX 
(第 6 行 ) 返回 字符 串 中 第 n BS CN) 之 前 (从 左边 开始 ) 的 所 有 字符 。 











+--------------------- 十 
| empno 

+--------------------- 十 
| 7654 

| 7654,7698 | 
| 7654,7698,7782 | 
| 7654,7698,7782,7788 | 
+------- + 


然后 ， 上 面 得 到 的 行 会 被 再 次 传递 给 SUBSTRING_INDEX 函数 (第 5 行 )。 这 一 次 的 参数 里 ， 
指定 的 第 n 次 出 现 分 隔 符 的 参数 值 是 -1， 这 意味 着 从 右边 数 第 半 次 出 现 分 隔 符 后， 其 右 侧 
所 有 字符 都 会 被 保留 下 来 。 


























最 后 ， 将 上 述 结果 放 入 一 个 子 查 询 中 。 
Oracle 
第 一 步 是 遍历 字符 串 。 
select emps,pos 
from (select ','||'7654,7698,7782,7788'||',' emps 


from t1) csv, 
(select rownum pos from emp) iter 





字符 串 处 理 | 117 


L 


where tter.pos <= 
((length(csv.emps)-length(replace(csv.emps,',')))/length(','))-1 


,7654,7698,7782,7788 ， 1 
,7654,7698,7782,7788 ， 2 
,7654,7698,7782,7788 ， 3 
,7654,7698,7782,7788 ， 4 


查询 返回 的 行 数 代表 了 列表 中 有 多 少 个 值 。Pos 列 至 关 重 要 ， 有 了 它 才 能 把 字符 串 解 








析 成 单个 的 值 。 使 用 SUBSTR 函数 和 INSTR 国 数 解析 字符 串 。Pos 列 被 用 来 找 出 分 隔 符 在 每 
个 字符 串 中 第 n 次 出 现时 的 位 置 。 由 于 字符 串 前 后 都 有 逗号 ， 就 不 再 需要 做 特别 的 检查 来 
确定 字符 串 的 起 止 位 置 。 被 传递 到 函数 SUBSTR 和 INSTR (第 7 ~ 9 行 ) 的 值 能 找 出 分 隔 符 
第 nn 次 和 第 n+l 次 出 现 的 位 置 。 通 过 使 用 下 一 个 有 逗号 〈 在 字符 串 中 下 一 个 逗号 出 现 的 位 





置 ) 





























的 返回 值 减 去 当前 逗号 〈 在 字符 串 中 当前 有 逗 号 所 在 的 位 置 ) 的 返回 值 ， 我 们 就 能 从 字 





符 串 中 提取 出 每 一 个 值 。 


select substr(emps, 
instr(emps,',',1,iter.pos)-41, 
instr(emps,',',1,iter.pos41) - 
instr(emps,',',1,iter.pos)) emps 
from (select ','||'7654,7698,7782,7788' | |',' emps 
from t1) csv, 
(select rownum pos from emp) iter 
where iter.pos «- 
(CLength(csv.emps) -Length(replace(csv.emps, ' , ')))/length(', '))-1 





最 后 ， 删 除 每 个 值 后 面 的 逗号 ， 将 其 转换 为 数字 并 放 和 人 和子 查询 中 。 


PostgreSQL 

WELEZ (第 6 ~ 9 行 ) 遍历 字符 串 。 返 回 的 行 数 取决 于 字符 串 中 含有 多 少 个 值 。 为 了 
找 出 字符 串 中 含有 多 少 个 值 ， 用 包含 分 隔 符 的 字符 串 总 长 度 减 去 去 掉 了 分 隔 符 的 字符 串 长 
HE (第 9 行 )。SPLIT_PART 函数 可 以 解析 字符 串 ， 并 找到 分 隔 符 第 n 次 出 现 之 前 的 那个 值 。 























select list.vals, 
split part(list.vals,',',iter.pos) as empno, 
iter.pos 

from (select id as pos from t10) iter, 
(select ','||'7654,7698,7782,7788' || ',' as vals 
from t1) list 

where iter.pos «- 

length(list.vals)-length(replace(list.vals,',','')) 


vals | empno | pos 





+ + 
,7654,7698,7782,7788, | | 
,7654,7698,7782,7788, | 7654 | 
| | 
| | 
| | 


,7654,7698,7782,7788 ， 7698 
,7654,7698,7782,7788 ， 7782 
,7654,7698,7782,7788 ， 7788 





最 后 ， 把 这 些 值 (EMPNO 列 ) 转换 成 数字 ， 并 将 其 放 入 子 查 询 中 。 


6.12 ” 按 字 母 表 顺序 排列 字符 


1. 问题 
你 想 按照 字母 对 




















顺序 对 字符 串 里 的 字符 进行 排序 ， 考 虑 下 面 的 结果 集 。 








rau 





MARTIN 
MILLER 
SCOTT 
SMITH 
TURNER 
WARD 


希望 得 到 如 下 所 示 的 结果 集 。 


OLD NAME . NEW, NAME 





= 





ADAMS AADMS 
ALLEN AELLN 
BLAKE ABEKL 
CLARK ACKLR 
FORD DFOR 
JAMES AEJMS 
JONES EJNOS 
KING GIKN 
MARTIN AIMNRT 
MILLER EILLMR 
SCOTT COSTT 
SMITH HIMST 
TURNER ENRRTU 
WARD ADRW 
2. 解决 方案 


本 问题 是 一 个 绝 佳 的 例证 ， 它 表明 为 什么 理解 一 种 数据 库 并 和 掌握 其 提供 的 各 项 功能 是 多 么 
重要 。 如 果 我 们 正在 使 用 的 数据 库 没有 提供 合适 的 内 置 函 数 来 帮 我 们 解决 问题 ， 我 们 就 需 
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要 想 一 些 别 出 心 裁 的 办 法 。 不 妨 比 较 下 面 的 MySQL 解决 方案 和 其 他 数据 库 的 解决 方案 。 


DB2 
为 了 对 多 行 字符 串 进 行 排序 ， 必 须 遍 历 每 个 字符 串 ， 然 后 对 其 中 的 字符 进行 排序 。 











1 select ename, 

2 max(case when pos-1 then c else '' end)|| 

3 max(case when pos-2 then c else '' end)|| 

4 max(case when pos-3 then c else '' end)|| 

5 max(case when pos-4 then c else '' end)|| 

6 max(case when pos-5 then c else '' end)|| 

7 max(case when pos=6 then c else '' end) 

8 from ( 

9 select e.ename, 

10 cast(substr(e.ename,iter.pos,1) as varchar(100)) c, 
11 cast(row_number()over(partition by e.ename 

12 order by substr(e.ename,iter.pos,1)) 
13 as integer) pos 

14 from emp e, 

15 (select cast(row_number()over() as integer) pos 

16 from emp) iter 

17 where iter.pos «- length(e.ename) 

18 )x 


19 group by ename 
MySQL 
这 里 的 关键 是 GROUP. CONCAT 函数 ， 该 函数 不 仅 能 连接 员工 名 字 字 符 串 里 的 每 个 字符 ， 还 
对 它们 进行 排序 。 


1 select ename, group_concat(c order by c separator '') 
2 from ( 

3 select ename, substr(a.ename,iter.pos,1) c 

4 from emp a, 

5 ( select id pos from t10 ) iter 

6 where iter.pos <= length(a.ename) 

7 )x 

8 group by ename 


Oracle 
SYS CONNECT. BY. PATH 函数 能 迭代 地 创建 一 个 列 | 于 





au, 
° 


1 select old_name, new_name 

2 from ( 

3 select old name, replace(sys connect by path(c,' '),' ') new name 
4 from ( 

5 select e.ename old name, 

6 row number() over(partition by e.ename 

7 order by substr(e.ename,iter.pos,1)) rn, 
8 substr(e.ename,iter.pos,1) c 

9 from emp e, 

10 ( select rownum pos from emp ) iter 

11 where iter.pos «- length(e.ename) 

12 order by 1 

13 )x 





14 start with rn = 1 

15 connect by prior rn = rn-1 and prior old name = old name 
16 ) 

17 where length(old name) = length(new name) 


PostgreSQL 

PostgreSQL 中 没有 能 够 方便 地 对 字符 串 中 的 字符 进行 排序 的 内 置 函数 ， 因 此 我 们 不 仅 要 遍 
历 每 个 字符 串 ， 还 需要 提前 知道 长 度 最 大 的 员工 名 字 。 为 了 提高 代码 的 可 读 性 ， 本 解决 方 
案 使 用 视图 v. 




















create or replace view V as 
select x.* 
from ( 
select a.ename, 
substr(a.ename,iter.pos,1) as c 
from emp a, 

(select id as pos from t10) iter 
where iter.pos <= length(a.ename) 
order by 1,2 

) x 


HRJ SELECT 语句 使 用 了 上 述 视 图 。 


1 select ename, 

2 max(case when pos=1 then 

3 case when cnt=1 then c 

4 else rpad(c,cast(cnt as integer),c) 
5 end 

6 else '' 

7 end)|| 

8 max(case when pos=2 then 

9 case when cnt=1 then c 

10 else rpad(c,cast(cnt as integer),c) 
11 end 

12 else '' 

13 end)|| 

14 max(case when pos=3 then 

15 case when cnt=1 then c 

16 else rpad(c,cast(cnt as integer),c) 
17 end 

18 else '' 

19 end)|| 

20 max(case when pos=4 then 

21 case when cnt=1 then c 

22 else rpad(c,cast(cnt as integer),c) 
23 end 

24 else '' 

25 end)|| 

26 max(case when pos=5 then 

27 case when cnt=1 then c 

28 else rpad(c,cast(cnt as integer),c) 
29 end 

30 else '' 

31 end)|| 

32 max(case when pos=6 then 
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else rpad(c,cast(cnt as integer),c) 


a.ename=b.ename and a.c=b.c ) as cnt, 


a.ename=b.ename and b.c<a.c) as pos 


Ó0000n0n 


33 case when cnt-1 then c 
34 

35 end 

36 else '' 

37 end) 

38 from ( 

39 select a.ename, a.c, 

40 (select count(*) 

41 from v b 

42 where 

43 (select Count(* )+1 

44 from v b 

45 where 

46 from v a 

47 ) x 

48 group by ename 

SQL Server 
Z) TLITI RETH, ADRES 

1 select ename, 

2 max(case when pos=1 
3 max(case when pos=2 
4 max(case when pos=3 
5 max(case when pos=4 
6 max(case when pos=5 
7 max(case when pos=6 
8 from ( 

9 select e.ename, 

10 substring(e.ename,iter.pos,1) as 
11 row number() over ( 
12 partition by e.ename 
13 








C, 


order by substring(e.ename,iter.pos,1)) as pos 
14 from emp e, 
(select row number()over(order by ename) as pos 


15 
16 from emp) iter 
17 where iter.pos «- len(e.ename) 
18 ) x 
19 group by ename 
3. 讨论 
DB2 和 SQL Server 


ARIE X 把 每 个 名 字 字 符 

















里 的 每 个 字符 都 提取 出 来 ， 并 当 作 一 行 返回 。 函 数 SUBSTR 





或 函数 SUBSTRING 提取 出 名 字 的 每 个 字符 ， 并 且 ROW. NUMBER 函数 按照 字母 表 顺 序 排序 每 


个 字符 。 


> 
ə 
> 
-— 
ua 
Qn = como ! 





为 了 把 字符 串 中 的 每 个 字母 都 提取 出 来 ， 并 当 作 一 行 返回 ， 我 们 必须 遍历 整个 字符 串 。 





i 








^F ETEHUABCHLEI ITER 来 完成 。 


现在 ， 每 个 名 字 的 字母 都 已 经 按照 字母 表 顺 序 排列 ， 最 后 一 步 就 是 将 这 些 字母 按 顺 序 连接 
成 新 的 字符 串 。CASE 语句 (# 2 ~ 7 行 ) 评估 每 个 字母 的 位 置 。 如 果 某 个 特定 位 置 的 字符 





被 发 现 了 ， 


























那么 它 就 会 被 连接 到 下 一 个 评估 (后续 的 CASE 语句 ) 的 结果 里 。 因 为 调用 了 聚 








合 国 数 MAX， 对 应 于 每 个 pos 值 只 有 一 个 字符 会 被 返回 ， 因 此 对 应 于 每 个 名 字 只 会 返回 一 
行 数据 。CASE 语句 一 共有 6 个 ， 这 是 因为 EMP 表 里 最 长 的 名 字 只 含有 6 个 字符 。 


MySQL 

















ARIE x (第 3 ~ 6 行 ) 把 每 个 名 字 的 字符 都 提取 出 来 ， 并 当 作 一 行 返回 。SUBSTR 函数 
可 以 提取 名 字 字 符 串 里 的 每 个 字符 。 











ENAME C 
ADAMS A 
ADAMS A 
ADAMS D 
ADAMS M 

S 


ARRIN E 

















ITER 用 于 遍历 字符 串 。 其 余 的 工作 都 交 由 GROUP_CONCAT 函数 完成 。 通 过 指定 排 


序 方式 ，GROUP_CONCAT 国 数 不 仅 能 串 接 每 个 字母 ， 还 能 按照 字母 表 顺 序 对 它们 进行 排序 。 


Oracle 





最 重要 的 工作 是 由 视图 x (第 5 ~ 11 行 ) 完成 的 ， 它 提取 出 每 个 名 字 的 字符 ， 并 按照 字母 
表 顺 序 排列 好 。 通 过 遍历 字符 串 并 对 字符 执行 排序 实现 了 这 一 点 。 查 询 语 句 的 剩余 部 分 只 
是 将 排 好 序 的 名 字 字 符 粘 结 到 一 起 而 已 。 


只 执行 内 嵌 视 图 X 的 话 ， 就 能 看 到 把 名 字 拆 解 之 后 得 到 的 各 个 字符 了 。 


OLD N 

















AME RN C 


然后 ， 提 取出 排 好 序 的 字符 并 重建 每 个 名 字 。 可 以 使 用 SYS. CONNECT. BY. PATH 函数 来 完成 
这 一 步 ， 它 把 所 有 的 字符 按 顺序 串 接 起 来 。 


OLD N 





AME |. NEW NAME 
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最 后 ， 只 保留 那些 和 原名 字 具 有 相同 长 度 的 字符 串 。 
PostgreSQL 
为 了 提高 可 读 性 ， 本 解决 方案 使 用 视图 v 来 遍历 字符 串 。 视 图 里 的 SUBSTR 函数 会 提取 每 个 
名 字 的 全 部 字符 ， 得 到 如 下 结果 集 。 
ENAME C 























> 
ə 
> 
-— 
ua 
Qn = como :! 





该 视图 也 按照 ENAME MESA FERRE hik Y EPF, ARME x (第 15 ~ 1847) 
从 视图 v 里 检索 出 名 字 、 字 符 、 字 符 在 名 字 里 出 现 的 次 数 及 其 位 置 〈 按 字母 表 顺 序 排列 ) 。 























对 于 该 解决 方案 而 言 ， 由 内 租 视 图 X 返回 的 CNT 列 和 Pos 列 非常 重要 。P0S 列 用 来 对 每 个 
字符 进行 排序 ， 而 CNT 列 用 于 确定 每 个 字符 在 名 字 中 出 现 的 次 数 。 最 后 一 步 是 ， 评 估 每 
个 字符 的 位 置 并 重建 名 字 。 注 意 ， 每 个 CASE 语句 实际 上 都 包含 两 个 CASE 子 句 。 这 是 为 
了 确认 一 个 字符 在 名 字 中 是 否 出 现 了 不 止 一 次 。 如 果 出 现 多 次 的 话 ， 那 么 返回 的 就 不 是 
该 字符 ， 而 是 由 CNT 个 该 字符 串 接 而 成 的 字符 串 。 聚 合 国 数 MAX 能 确保 每 个 名 字 只 返回 
一 行 数据 。 


6.43 识别 字符 串 里 的 数字 字符 
1. 问题 


你 有 一 列 包 含 字符 的 数据 。 不 过 ， 这 些 数 据 里 不 仅 有 数字 ， 还 有 其 他 字符 。 考 虑 下 面 的 
视图 v. 









































create view V as 
select replace(mixed,' 
from ( 
select substr(ename,1,2)| | 
cast(deptno as char(4))|| 
substr(ename,3,2) as mixed 


,'') as mixed 


from emp 

where deptno - 10 

union all 

select cast(empno as char(4)) as mixed 
from emp 


where deptno - 20 





union all 
select ename as mixed 
from emp 
where deptno = 30 
) x 


select * from v 


CL10AR 
KI10NG 
MI10LL 
7369 
7566 
7788 
7876 
7902 
ALLEN 
WARD 
MARTIN 
BLAKE 
TURNER 
JAMES 


你 希望 筛选 出 只 包含 数字 或 至 少 有 一 个 数字 的 行 。 如 果 既 有 数字 又 有 其 他 字符 ， 你 希望 删 
除非 数字 字符 ， 只 返回 数字 。 对 于 以 上 示例 数据 而 言 ， 你 希望 得 到 下 面 的 结果 集 。 








2. 解决 方案 
函数 REPLACE 和 TRANSLATE 对 于 操作 字符 






































和 单个 字符 非常 有 用 。 关 键 在 于 把 全 部 数字 替 


换 为 某 个 字符 ， 这 样 就 能 通过 读 取 该 字符 的 方式 很 方便 地 隔离 和 识别 数字 字符 。 


DB2 





使 用 函数 TRANSLATE, REPLACE 和 POSSTR 分 离 出 每 一 行 的 数字 字符 。 还 需要 在 视图 v 里 调用 
CAST。 否 则 的 话 ， 会 因为 类 型 转换 错误 导致 视图 创建 失败 。 你 需要 使 用 REPLACE 函数 删除 


无 关 的 空白 字符 ， 以 便 转 换 为 固定 长 度 的 





1 select mixed old, 

2 cast( 

3 case 

4 when 

5 replace( 

















CHAR 类 型 。 
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6 translate(mixed,'9999999999','0123456789'),'9','') = '' 
7 then 

8 mixed 

9 else replace( 

10 translate(mixed, 

11 repeat('£',length(mixed)), 

12 replace( 

13 translate(mixed,'9999999999','0123456789'),'9','')), 
14 ngo) 

15 end as integer ) mixed 

16 from V 


17 where posstr(translate(mixed,'9999999999','0123456789'),'9') > 0 


MySQL 
MySQL 的 语法 略 有 不 同 ， 下 面 是 视图 v 的 定义 。 


create view V as 
select concat( 
substr(ename,1,2), 
replace(cast(deptno as char(4)),' ',''), 
substr(ename,3,2) 
) as mixed 
from emp 
where deptno - 10 
union all 
select replace(cast(empno as char(4)), ' ', '') 
from emp where deptno - 20 
union all 
select ename from emp where deptno - 30 


























由 于 MySQL 不 支持 TRANSLATE 函数 ， 我 们 必须 遍历 每 一 行 字符 串 ， 并 评估 每 一 个 字符 。 


1 select cast(group concat(c order by pos separator '') as unsigned) 
2 as MIXED1 
3 from ( 
4 select v.mixed, iter.pos, substr(v.mixed,iter.pos,1) as c 
5 from V, 
6 ( select id pos from t10 ) iter 
7 where iter.pos «- length(v.mixed) 
8 and ascii(substr(v.mixed,iter.pos,1)) between 48 and 57 
9 ) y 
10 group by mixed 
11 order by 1 
Oracle 











使 用 函数 TRANSLATE, REPLACE 和 INSTR 分 离 出 每 一 行 的 数字 字符 。 在 视图 V 中 调用 CAST 不 
是 必须 的 。 使 用 REPLACE 函数 删除 无 关 的 空白 字符 ， 以 便 转 换 为 固定 长 度 的 CHAR 类 型 。 如 





果 希 望 在 视图 的 定义 里 使 用 显 式 类 型 转换 ， 不 妨 转换 为 VARCHAR 类 型 。 


1 select to number ( 

2 case 

3 when 

4 replace(translate(mixed,'0123456789','9999999999'),'9') 
5 is not null 





6 then 

7 replace( 

8 translate(mixed, 

9 replace( 

10 translate(mixed,'0123456789','9999999999'),'9'), 
11 rpad('#',length(mixed),'#')),'#') 
12 else 

13 mixed 

14 end 

15 ) mixed 

16 from V 


17 where instr(translate(mixed,'0123456789','9999999999'),'9') > 0 


PostgreSQL 

使 用 函数 TRANSLATE, REPLACE 和 STRPOS 分 离 出 每 一 行 的 数字 字符 。 在 视图 V 中 调用 CAST 
不 是 必须 的 。 使 用 REPLACE 函数 删除 无 关 的 空白 字符 ， 以 便 转 换 为 固定 长 度 的 CHAR 类 型 。 
如 果 希 望 在 视图 的 定义 里 使 用 显 式 类 型 转换 ， 建 议 转 换 为 VARCHAR2 类 型 。 











1 select cast( 

2 case 

3 when 

4 replace(translate(mixed,'0123456789','9999999999'),'9','') 
5 is not null 

6 then 

7 replace( 

8 translate(mixed, 

9 replace( 

10 translate(mixed,'0123456789','9999999999!),'9','''), 
11 rpad('£',length(mixed), '#')),'#','') 

12 else 

13 mixed 

14 end as integer ) as mixed 

15 from V 


16 where strpos(translate(mixed, '0123456789','9999999999'),'9') > 0 


SQL Server 

使 用 内 置 函 数 ISNUMERIC 和 通配符 搜索 能 很 容易 识别 出 含有 数字 的 字符 串 ， 但 是 SQL 
Server 不 支持 TRANSLATE 国 数 ， 我 们 无 法 高 效 地 从 字符 串 里 提取 数字 字符 。 

3. 讨论 

TRANSLATE 函数 在 这 里 非常 有 用 ， 有 了 它 ， 我 们 很 容易 把 数字 字符 从 其 他 字符 分 离 识别 出 
来 。 关 键 在 于 把 所 有 数字 先 替 换 为 某 个 字符 。 这 样 的 话 ， 我 们 只 需要 搜索 一 个 既定 字符 ， 
而 不 必 去 匹配 不 同 的 数字 。 

DB2. Oracle 和 PostgreSQL 

这 几 种 数据 库 的 语法 稍 有 不 同 ， 但 方法 相同 。 这 里 我 选择 讨论 PostgreSQL 的 解决 方案 。 
真正 的 工作 是 由 函数 TRANSLATE 和 REPLACE 完成 的 。 为 了 得 到 最 终 的 结果 集 ， 需 要 多 次 使 
用 这 两 个 函数 ， 下 面 的 查询 包含 了 每 一 次 使 用 函数 的 情况 。 


select mixed as orig, 
translate(mixed,'0123456789','9999999999') as mixed1, 
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replace(translate(mixed,'0123456789','9999999999'),'9','') as mixed2, 
translate(mixed, 


replace( 


translate(mixed,'0123456789','9999999999'),'9',''), 
rpad('#',length(mixed),'#')) as mixed3, 


replace( 


translate(mixed, 


replace( 


translate(mixed,'0123456789','9999999999'),'9',''), 
rpad('#',length(mixed),'#')),'#','') as mixed4 


from V 


where strpos(translate(mixed,'0123456789','9999999999'),'9') > 0 


ORIG | MIXED1 | 
SONS r S EADEM 
CL10AR | CL99AR | 
KI10NG | KI99NG | 
MI10LL | MI99LL | 
7369 | 9999 | 
7566 | 9999 | 
7788 | 9999 | 
7876 | 9999 | 
7902 | 9999 | 

首先 要 注意 到 ， 

就 会 理解 其 工作 原 到 


用 TRANSLATE f 


MIXED2 | MIXED3 | MIXED4 | MIXED5 
+-------- +-------- +-------- 
CLAR | ##10## | 10 | 10 
KING | ##10## | 10 | 10 
MILL | ##10## | 10 | 10 
| 7369 | 7369 | 7369 
| 7566 | 7566 | 7566 
| 7788 | 7788 | 7788 
| 7876 | 7876 | 7876 
| 7902 | 7902 | 7902 





不 包含 任何 数字 的 行 会 被 删 掉 。 仔 细 阅 读 上 述 结 果 集 的 每 一 列 之 后 ， 我 们 








EE。 被 往 选 出 来 的 行 包括 ORIG 列 的 值 和 构成 最 终结 果 集 的 行 。 首 先 ， 调 
数 把 所 有 数字 都 转换 为 9 (事实 上 ， 我 们 可 以 选择 任何 数字 ， 这 里 的 9 是 


任意 选 的 )， 这 一 结果 就 是 MIXED1 列 的 值 。 现 在 所 有 数字 都 变 成 了 9， 它们 能 被 当 作 一 种 




















单一 字符 来 处 旭 
成 了 9，REPLACE 函数 





EE。 然后 ， 通 过 调 月 


=> A 
只 需 简 














H REPLACE 函数 删除 所 有 的 数字 。 由 于 数字 都 已 经 被 替换 
单 地 搜索 9， 就 可 以 删除 它们 。 这 一 结果 用 MIXED2 列 来 表示 。 


下 一 步 ， 为 了 计算 MIXED3， 需 要 使 用 MIXED2 的 返回 值 。 把 MIXED2 列 和 ORIG 列 进行 比较 。 
如 果 ORIG 匹配 到 了 MIXED2 的 任意 字符 ， 那 么 就 调用 TRANSLATE 函数 将 其 替换 为 #。MIXED3 








列 的 结果 显示 


作 原 理 。MIXED1 的 结 


























这 些 字母 〈 而 不 是 数字 ) 已 经 被 挑 出 来 ， 并 转换 为 其 个 字符 (#)。 现 在 所 
有 非 数字 字符 都 变 成 了 #， 因 而 它们 也 能 被 当 作 一 种 单一 字符 来 处 理 。 下 一 步 ， 为 了 得 到 
MIXED4， 调 用 REPLACE 函数 找到 并 删除 每 一 行 里 的 # 字 ， 剩 余 的 部 分 就 只 有 数字 。 最 后 ， 
把 数值 字符 转换 为 数字 形式 。 现 在 已 经 完成 了 所 有 步骤 ， 我 们 也 就 明白 了 WHERE 子 句 的 工 

















果 被 传递 给 STRP0S 函数 ， 如 果 发 现 了 一 个 9 (定位 字符 串 中 第 一 次 出 





H 9 的 位 置 )， 那 么 函数 返回 值 一 定 大 于 0。 也 就 是 说 ， 若 返回 
至 少 存在 一 个 数字 ， 所 以 这 一 行 应 该 被 保留 下 来 。 


MySQL 




















首先 遍历 每 个 字符 串 








,H 


E 估 每 个 字符 并 判断 其 是 否 为 数字 。 














值 大 于 0， 那 么 意味 着 该 行 


select v.mixed, iter.pos, substr(v.mixed,iter.pos,1) as c 


from V, 


( select id pos from t10 ) iter 
where iter.pos <= length(v.mixed) 


order by 


1,2 








| CL10AR 
| CL10AR 
| CL10AR 
| CL10AR 
| CL10AR 
| CL10AR 


A C ———Á—MÀÓ— P —ÀÁMÓ— 


Un + QÓ N P 


| 
| 
| 
| 
| 
| 
+ 


+ 
i 
' 
' 
' 
' 
' 
' 
' 
一 一 一 一 + 一 + 
H 
' 
' 
' 
' 
' 
一 一 一 一 + 一 + 
H 
' 
' 
' 
' 
+ 


现在 可 以 单独 评估 字符 串 中 的 每 个 字符 ， 接 下 来 需要 筛选 出 在 5 列 中 有 一 个 数字 的 行 。 


select v.mixed, iter.pos, substr(v.mixed,iter.pos,1) as c 


到 这 一 步 ,C 列 只 剩 下 数字 。 下 面 调用 GROUP. CONCAT 函数 串 接 这 些 数 字 ， 


的 数 





from V, 


( select id pos from t10 ) iter 
where iter.pos <= length(v.mixed) 
and ascii(substr(v.mixed,iter.pos,1)) between 48 and 57 
order by 1,2 


+-------- +------ +------ + 
| mixed | pos | c | 
+-------- +------ +------ + 
| 7369 | 1| 7 | 
| 7369 | 2 |3 | 
| 7369 | 3| 6 | 
| 7369 | 4| 9 | 
| CL10AR | 3 |1 | 
| CL10AR | 4| 0 | 
+-------- +------ +------ + 





形成 MIXED 列 


M 





字 。 需 要 将 最 后 的 结果 转换 为 数字 类 型 。 


select cast(group_concat(c order by pos separator '') as unsigned) 
as MIXED1 


from ( 


select v.mixed, iter.pos, substr(v.mixed,iter.pos,1) as c 


from V, 


( select id pos from t10 ) iter 
where iter.pos «- length(v.mixed) 
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and ascii(substr(x.mixed,iter.pos,1)) between 48 and 57 


)y 
group by mixed 
order by 1 


| | 
| | 
| | 
| | 
| 7566 | 
| | 
| | 
| | 


最 后 要 注意 ， 每 个 字符 串 里 的 所 有 数字 字符 都 会 被 串 接 成 一 个 新 数字 。 例 如 ， 输 入 值 
99Gennick87 会 导致 数字 9987 被 返回 。 这 一 点 需要 特别 注意 ， 尤 其 是 处 理 序列 化 数据 的 时 候 。 


6.14 提取 第 7 个 分 隔 子 字符 串 


1. 问题 
你 想 从 一 个 字符 串 里 提取 出 特定 的 分 隔 子 字符 串 。 考 虑 下 面 的 视图 V， 它 生成 了 本 问题 的 
源 数 据 。 
create view V as 
select 'mo,larry,curly' as name 
from t1 
union all 


select 'tina,gina,jaunita,regina,leena' as name 
from t1 


上 述 视图 输出 如 下 所 示 的 数据 。 


select * from v 















































mo,larry,curly 
tina,gina,jaunita,regina,leena 


你 希望 提取 每 一 行 的 第 二 个 名 字 ， 并 得 到 下 面 这 样 的 结果 集 。 








2. 解决 方案 
解决 这 一 问题 的 关键 是 ， 把 每 一 个 名 字 转 换 为 单独 的 一 行 ， 并 保持 每 一 个 名 字 在 列表 里 的 











顺序 不 变 。 具 体 方 法 取决 于 你 所 使 用 的 数据 库 。 


DB2 
遍历 视图 V 返 





回 的 NAME， 并 使 用 ROW. NUMBER 函数 筛选 出 每 一 个 字符 串 里 的 第 二 个 名 字 。 








select substr(c,2,locate(',',c,2)-2) 
from ( 
select pos, name, substr(name, pos) c, 


row_number() over(partition by name 
order by length(substr(name,pos)) desc) rn 


from ( 


[ENT 


select ',' ||csv.name|| ',' as name, 


cast(iter.pos as integer) as pos 


9 from V csv, 


(select row number() over() pos from t100 ) iter 


11 where iter.pos «- length(csv.name)42 


) x 


13 where length(substr(name,pos)) » 1 
14 and substr(substr(name,pos),1,1) = ',' 


) y 


16 where rn = 2 


MySQL 
遍历 视图 V 返 


1 
2 
3 
4 
5 
6 
f. 
8 
9 


10 
11 where 


Oracle 
遍历 视图 V 返 


10 


回 的 NAME， 并 使 用 喜 号 的 位 置 来 筛选 出 每 一 个 字符 串 里 的 第 二 个 名 字 。 








select name 
from ( 
select iter.pos, 


substring_index( 
substring_index(src.name,',',iter.pos),',',-1) name 


from V src, 


(select id pos from t10) iter, 


where iter.pos <= 


length(src.name)-length(replace(src.name,',','')) 
) x 
pos = 2 











回 的 NAME， 并 使 用 SUBSTR 函数 和 INSTR 函数 提取 每 个 列表 里 的 第 二 个 名 字 。 





1 select sub 

2 from ( 

3 select iter.pos, 

4 src.name, 

5 substr( src.name, 

6 instr( src.name,',',1,iter.pos )+1, 

7 instr( src.name,',',1,iter.pos41 ) - 

8 instr( src.name,',',1,iter.pos )-1) sub 

9 from (select ','||name||',' as name from V) src, 


(select rownum pos from emp) iter 


11 where iter.pos « length(src.name)-length(replace(src.name,',')) 


12 


) 


13 where pos = 2 
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PostgreSQL 
使 用 SPLIT PART 国 数 把 每 一 个 单独 的 名 字 作 为 一 行 返 回 。 





1 select name 

2 from ( 

3 select iter.pos, split part(src.name,',',iter.pos) as name 
4 from (select id as pos from t10) iter, 

5 (select cast(name as text) as name from v) src 

7 where iter.pos «- 

8 length(src.name)-length(replace(src.name,',',' '))41 
9 )x 

10 where pos - 2 


SQL Server 
遍历 视图 V 返回 的 NAME， 并 使 用 ROW. NUMBER 函数 筛选 出 每 一 个 字符 串 里 的 第 二 个 名 字 。 











H 








1 select substring(c,2,charindex(',',c,2)-2) 
2 from ( 
3 select pos, name, substring(name, pos, len(name)) as c, 
4 row_number() over( 
5 partition by name 
6 order by len(substring(name,pos,len(name))) desc) rn 
7 from ( 
8 select ',' + csv.name + ',' as name, 
9 iter.pos 
10 from V csv, 
11 (select id as pos from t100 ) iter 
12 where iter.pos <= len(csv.name)42 
13 )x 
14 where len(substring(name,pos,len(name))) » 1 
15 and substring(substring(name,pos,len(name)),1,1) = ',' 
16 ) y 
17 where rn = 2 
3. 讨论 
DB2 和 SQL Server 


这 两 种 数据 库 的 解决 方案 的 语法 稍 有 不 同 ， 但 方法 相同 。 后 面 的 讨论 里 我 们 以 DB2 数据 库 
的 解决 方案 为 主 。 使 用 内 艇 视图 X 遍 历 字 符 串 ， 结 果 如 下 所 示 。 


select ','||csv.name|| ',' as name, 
iter.pos 
from v csv, 
(select row number() over() pos from t100 ) iter 
where iter.pos <= Length(csv.name )+2 











EMPS POS 
,tina,gina,jaunita,regina,leena, 1 
,tina,gina,jaunita,regina,leena, 2 
,tina,gina,jaunita,regina,leena, 3 


然后 遍历 字符 串 中 的 每 一 个 字符 。 
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select pos, name, substr(name, pos) c, 
row number() over(partition by name 
order by length(substr(name, pos)) desc) rn 
from ( 
select ','||csv.name||',' as name, 
cast(iter.pos as integer) as pos 
from v csv, 
(select row number() over() pos from t100 ) iter 
where iter.pos <= length(csv.name)42 
) x 
where length(substr(name,pos)) » 1 


POS NAME C RN 


1 ,mo,larry,curly, ,mo,larry,curly, 1 
2 ,mo,larry,curly, mo,larry,curly, 2 
3 ,mo,larry,curly, o,larry,curly, 3 
4 ,mo,larry,curly, ,larry,curly, 4 








现在 ， 我 们 得 到 了 含有 字符 串 不 同 部 分 的 数据 ， 并 且 很 容易 筛选 出 要 保留 的 行 。 我 们 感 兴 
趣 的 行 都 以 逗号 开头 ， 其 余 的 行 都 将 被 舍弃 。 


select pos, name, substr(name,pos) c, 
row number() over(partition by name 
order by length(substr(name, pos)) desc) rn 
from ( 
select ','||csv.name||',' as name, 
cast(iter.pos as integer) as pos 
from v csv, 
(select row number() over() pos from t100 ) iter 
where iter.pos <= length(csv.name)42 


) x 
where length(substr(name,pos)) » 1 
and substr(substr(name,pos),1,1) = ',' 
POS NAME C RN 
1 ,no,larry,curly, ,no,larry,curly, 
4 ,no,larry,curly, ,Varry,curly, 
10 ,no,larry,curly, ,curly, 


1 ,tina,gina,jaunita,regina,leena,  ,tina,gina,jaunita,regina,leena, 
6 ,tina,gina,jaunita,regina,leena,  ,gina,jaunita,regina,leena, 

11 ,tina,gina,jaunita,regina,leena,  ,jaunita,regina,leena, 

19 ,tina,gina,jaunita,regina,leena,  ,regina,leena, 

26 ,tina,gina,jaunita,regina,leena,  ,leena, 


这 是 确定 如 何 得 到 第 个子 字符 串 的 重要 一 步 。 注 意 ， 由 于 如 下 所 示 的 WHERE 条 件 ， 许 多 
行 已 经 被 删除 。 
substr(substr(name,pos),1,1) = ',' 


ÈE, larry curly 这 个 字符 串 的 原 排名 为 4， 现在 的 排名 却 变 成 了 2。 由 于 WHERE 子 句 会 
在 SELECT 之 前 执行 ， 因 此 以 和 逗号 开头 的 行 会 先 被 筛选 出 来 ， 之 后 才 调用 ROW. NUMBER 函数 


mm OONN PF QON P :! 
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决定 每 一 行 的 编号 。 此 时 可 以 很 清楚 地 看 到 ， 要 得 到 第 个子 字符 串 ， 只 需要 在 WHERE 子 
句 里 指定 RN 等 于 n 即 可 。 最 后 ， 只 保留 我 们 感 兴趣 的 行 (本 例 中 是 RN 等 于 2 的 行 )， 并 调 
用 SUBSTR 函数 提取 那 一 行 的 名 字 。 最 后 留 下 来 的 是 每 行 中 的 第 一 个 名 字 : ,Larry,curty， 
里 的 larry 和 ,gina,jaunita,regina,leena, 里 的 gina, 


MySQL 
使 用 内 嵌 视 图 X 遍 历 每 个 字符 串 ， 我 们 可 以 通过 计算 字符 串 中 的 分 隔 符 的 个 数 来 确定 该 字 
符 串 中 有 多 少 个 值 。 


select iter.pos, src.name 
from (select id pos from t10) iter, 
V src 
where iter.pos «- 
length(src.name)-length(replace(src.name, ',','')) 




















+ 
| 

+ 

| mo,larry,curly 

| mo,larry,curly 

| tina,gina,jaunita,regina,leena 
| tina,gina,jaunita,regina,leena 
| tina,gina,jaunita,regina,leena 
| tina,gina,jaunita,regina,leena 
+ 








上 述 查 询 结 果 中 ， 每 个 字符 串 对 应 的 数据 行 相 较 于 字符 串 里 实际 的 值 的 个 数 少 了 一 行 ， 因 
为 这 就 是 我 们 需要 的 。SUBSTRING_INDEX 函数 可 以 解析 我 们 需要 的 这 些 值 。 


select iter.pos,src.name namel, 
substring_index(src.name,',',iter.pos) name2， 
substring_index( 
substring_index(src.name,',',iter.pos),',',-1) name3 
from (select id pos from t10) iter, 
V src 
where iter.pos «- 
length(src.name)-length(replace(src.name, ',','')) 














+------ +-------------------------------- +-------------------------- +--------- + 
| pos | namel | name2 | name3 | 
+------ +-------------------------------- +-------------------------- +--------- + 
| 1 | mo,larry,curly | mo | mo | 
| 2 | mo,larry,curly | mo,Larry | Larry | 
| 1 | tina,gina,jaunita,regina,leena | tina | tina | 
| 2 | tina,gina,jaunita,regina,leena | tina,gina | gina | 
| 3 | tina,gina,jaunita,regina,leena | tina,gina,jaunita | jaunita | 
| 4 | tina,gina,jaunita,regina,leena | tina,gina,jaunita,regina | regina | 
+------ +-------------------------------- +-------------------------- +--------- + 


我 已 经 展示 了 3 个 和 名 字 相 关 的 字段 ， 我 们 可 以 据 此 了 解答 套 的 SUBSTRING INDEX 函数 是 
如 何 工作 的 。 内 层 的 函数 能 够 找到 喜 号 第 半 次 出 现 的 位 置 ， 并 提取 该 位 置 左 侧 的 全 部 字 
符 。 外 层 的 函数 可 以 找到 〈 从 字符 串 的 末尾 开始 计数 ) 逗号 第 一 次 出 现 的 位 置 ， 并 提取 其 
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右 侧 的 全 部 字符 。 最 后 ， 将 POS ET n 的 NAMES 值 保留 下 来 ， 本 例 中 为 2。 


Oracle 




















ERARE EDE Er, FI REAR ERRE EH BUB 23k T pi HR 
有 多 少 个 值 。 本 解决 方案 通过 计算 字符 串 里 分 隔 符 的 出 现 次数 得 到 每 个 字符 串 含 有 多 少 个 





值 。 因 为 字符 串 前 后 者 
TAB E S dE 


























Bb 有 逗号 ， 字 符 串 里 值 的 个 数 等 于 逗号 出 现 的 次 数 减 1。 然 后 ， 这 
F， 并 执行 连接 查询 ， 该 表 的 记录 条 数 至 少 要 等 于 全 体 字 符 串 中 值 的 

















n 


个 数 的 最 大 值 。 函 数 SUBSTR 和 INSTR 利用 Pos 值 解 析 每 个 字符 串 。 


select iter.pos, src.name, 
substr( src.name, 
instr( src.name,',',1,iter.pos )41, 
instr( src.name,',',1,iter.pos«1 ) - 
instr( src.name,',',1,iter.pos )-1) sub 

from (select ','||name||'," as name from v) src, 

(select rownum pos from emp) iter 

where iter.pos < length(src.name)-length(replace(src.name, ',')) 


,no,larry,curly, 


, tina,gina,jaunita,regina,leena, 


,no,larry,curly, 


1 
1 
2 
2 , tina,gina,jaunita,regina,leena, 
3 ,mo,larry,curly, 
3 , tina,gina,jaunita,regina,leena, 
4 , tina,gina,jaunita,regina,leena, 
5 , tina,gina,jaunita,regina,leena, 


jaunita 
regina 
leena 








第 一 次 调用 SUBSTR 函数 中 的 INSTR 函数 可 以 确定 要 提取 的 子 字 符 串 的 开始 位 置 。 第 二 次 调 








用 SUBSTR 函数 中 的 INSTR 函数 能 够 找到 第 n ESAME (与 开始 位 置 相 同 ) 和 第 nel 个 


过 号 的 位 置 。 上 述 两 个 值 相 减 得 到 了 要 提取 的 字符 串 的 长 度 。 因 为 每 个 值 被 解析 后 都 作为 
单独 的 行 返回 ， 只 需要 简单 地 指定 WHERE POS = n， 就 能 筛选 出 第 个子 字符 串 (本 例 中 ， 
WHERE POS = 2， 因 此 要 提取 的 是 列表 中 第 2 个 子 字符 串 )。 


PostgreSQL 








BEHARI Es 











Xx 遍历 每 个 字符 串 。 返 





回 的 行 数 取决 于 每 个 字符 








中 包含 多 少 个 值 。 为 了 得 








到 字符 串 里 值 的 个 数 ， 我 们 需要 计算 出 字符 串 中 分 隔 符 出 现 的 次 数 ， 然 后 再 加 上 1。 函 数 
SPLIT PART 使 用 POS 的 值 找 到 分 隔 符 第 n 次 出 现 的 位 置 ， 并 解析 字符 串 提 取出 的 名 字 。 


select iter.pos, src.name as namel, 
split_part(src.name,',',iter.pos) as name2 
from (select id as pos from t10) iter, 
(select cast(name as text) as name from v) src 
where iter.pos «- 
length(src.name)-length(replace(src.name, ',',''))41 





pos | name1 | name2 
DEN 下 
1 | mo,larry,curly | mo 
2 | mo,larry,curly | Larry 
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3 | mo,larry,curly | curly 

1 | tina,gina,jaunita,regina,leena | tina 

2 | tina,gina,jaunita,regina,leena | gina 

3 | tina,gina,jaunita,regina,leena | jaunita 
4 | tina,gina,jaunita,regina,leena | regina 
5 | tina,gina,jaunita,regina,leena | leena 














RIRI f Wi NAME 列 ， 是 为 了 说 明 SPLIT PART 函数 是 如 何 借助 POS 解析 每 个 字符 串 的 。 
一 旦 所 有 字符 串 都 被 解析 过 了 ， 最 后 一 步 就 是 筛选 Pos 等 于 我 们 感 兴趣 的 第 n 个 子 字符 串 
所 在 的 行 ， 本 例 中 为 2。 


6.15 解析 IP 地 址 

















1. 问题 

你 想 把 一 个 IP 地 址 的 各 个 字段 分 解 为 四 列 ， 考 虑 下 面 的 IP 地 址 。 
111.22.3.4 

你 希望 查询 语句 能 返回 如 下 所 示 的 结果 。 
A B C D 


2. 解决 方案 
具体 的 解决 方案 取决 于 数据 库 提供 的 内 置 函数 。 不 管 是 哪 种 数据 库 ， 关 键 之 处 都 在 于 如 何 
快速 定位 英文 句号 以 及 英文 句号 前 后 的 数字 。 
DB2 
使 用 WITH 子 名 递归 地 查询 针对 卫 地 址 的 循环 操作 ， 同 时 使 用 SUBSTR 函数 可 以 很 容易 解 
PT IP HHE, E P 地址 开头 加 上 一 个 英文 句号 ， 这样 每 一 组 数字 的 开头 位 置 都 有 英文 句号 ， 
因而 我 们 能 以 相同 的 方式 处 理 所 有 的 四 组 数字 。 

1 with x (pos,ip) as ( 

2 values (1,'.92.111.0.222') 


3 union all 
4 select pos+1,ip from x where pos+1 <= 20 






































5 ) 

6 select max(case when rn-1 then e end) a, 

7 max(case when rn-2 then e end) b, 

8 max(case when rn-3 then e end) c, 

9 max(case when rn-4 then e end) d 

10 from ( 

11 select pos,c,d, 

12 case when posstr(d,'.') > 0 then substr(d,1,posstr(d,'.')-1) 
13 else d 

14 end as e, 

15 row number() over(order by pos desc) rn 

16 from ( 

17 select pos, ip,right(ip,pos) as c, substr(right(ip,pos),2) as d 
18 from x 





MySQL 


where pos <= length(ip) 
and substr(right(ip,pos),1,1) = '.' 


) x 
)y 


使 用 函数 SUBSTR_INDEX 很 容易 解析 IP 地 址 。 


1 select substring index(substring index(y.ip,'.',1),'. 
2 substring index(substring index(y.ip,'.',2),'. 
3 substring index(substring index(y.ip,'.',3),'. 
4 substring index(substring index(y.ip,'.',4),'. 
5 from (select '92.111.0.2' as ip from t1) y 
Oracle 
使 用 内 置 国 数 SUBSTR 和 INSTR 解析 和 遍历 IP 地 址 。 
1 select ip, 
2 substr(ip, 1, instr(ip,'.')-1) a, 
3 substr(ip, instr(ip,'.')41, 
4 instr(ip,'.',1,2)-instr(ip,'. 
5 substr(ip, instr(ip,'.',1,2)41, 
6 instr(ip,'.',1,3)-instr(ip,'. 
7 substr(ip, instr(ip,'.',1,3)41 ) d 
8 from (select '92.111.0.2' as ip from t1) 
PostgreSQL 


使 用 内 置 函数 SPLIT PART 解析 IP 地 址 。 


select split part(y.ip,'. 
split part(y.ip,'. 


split part(y.ip, 


split part(y.ip,'. 
from (select cast('92. 


SQL Server 
使 用 WITH 子 句 递归 地 查询 针对 IP 地 址 的 循环 操作 ， 同 时 使 用 SUBSTR 函数 可 以 很 容易 解析 
IP 地址。 在 人 P 地 址 开头 加 上 英文 句号 ， 这样 每 一 组 数字 的 开头 位 置 都 有 英文 句号 ， 因 而 
我 们 能 以 相同 的 方式 处 理 全 部 4 组 数字 。 





PB = P= p> 
Q N P @O XO O + O n R QQ N P. 


= 
+ 


with x (pos,ip) as ( 


',1) as 
',2) as 
.',3) as 
',4) as 
111.0.2' 


as text) as ip from t1) as y 


select 1 as pos,'.92.111.0.222' as ip from t1 


union all 


select pos+1,ip from x where pos+1 <= 20 


) 
select max(case when 
max(case when 
max(case when 
max(case when 
from ( 
select pos,c,d, 


rn=1 then 
rn=2 then 
rn=3 then 
rn=4 then 


e end) a, 
e end) b, 
e end) c, 
e end) d 


case when charindex('.',d) » 0 
then substring(d,1,charindex('.',d)-1) 


else d 


')-1 ) b, 


',1,2)-1 ) C, 
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15 end as e, 


16 row_number() over(order by pos desc) rn 
17 from ( 
18 select pos, ip,right(ip,pos) as c, 
19 substring(right(ip,pos),2,len(ip)) as d 
20 from x 
21 where pos «- len(ip) 
22 and substring(right(ip,pos),1,1) = '.' 
23 )x 
24 ) y 
3. 讨论 








有 了 数据 库 提供 的 内 置 函 数 ， 我 们 很 容易 遍历 字符 串 的 各 个 部 分 。 关 键 之 处 在 于 如 何 定位 
IP 地 址 里 英文 句号 。 然 后 ， 我 们 就 能 解析 英文 句号 之 间 的 数字 。 
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数值 处 理 





本 章 主要 介绍 涉及 数字 的 常见 操作 ， 包 括 数值 计算 。 尽 管 对 于 复杂 的 数值 计算 而 言 ，SQL 
并 非 首 选 工具 ， 但 它 足以 胜任 日 常数 值 处 理工 作 。 











本 章 中 的 一 些 实例 使 用 了 聚合 函数 和 GROUP BY 子 句 。 如 果 你 不 熟悉 SQL 的 


心 4 ， 分 组 操作 ， 请 先 阅读 A.1 节 。 
eus 


7.4 计算 平均 值 


1. 问题 

Ed n ccu í Mess 
望 知 道 全 部 员工 的 平均 工资 ， 同 时 也 想 知道 每 个 部 门 的 平均 工资 。 

2. 解决 方案 

为 了 计算 所 有 员工 的 平均 工资 ， 只 需要 针对 SAL 列 调用 AvG 函数 即 可 。 由 于 没有 使 用 

WHERE 子 句 ， 因 此 AvG 函数 会 计算 所 有 非 Null 值 的 平均 值 。 


1 select avg(sal) as avg_sal 
2 from emp 











AVG_SAL 


2073.21429 


为 了 计算 每 个 部 门 的 平均 工资 ， 需 要 使 用 GROUP BY 子 句 来 对 部 门 进行 分 组 。 


1 select deptno, avg(sal) as avg_sal 
2 from emp 
3 group by deptno 
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DEPTNO AVG_SAL 


10 2916.66667 


20 2175 
30 1566.66667 
3. 讨论 
针对 整个 表 计 算 平 均值 时 ， 只 要 对 感 





句 ° 请 记 住 , 


BY +- 





create table t2(sal integer) 
insert into t2 values (10) 
insert into t2 values (20) 
insert into t2 values (null) 


select avg(sal) 


from t2 from t2 
AVG(SAL) 30/2 
15 15 


select avg(coalesce(sal,0)) 
from t2 


AVG(COALESCE(SAL ,0)) 














COALESCE 国 数 会 返回 其 参数 列表 中 的 第 一 个 非 Null 值 
这 样 平 均值 的 计算 结果 也 会 发 生变 化 。 当 使 用 























H Null, 


理 
A^ — 300 ^N. 


本 解决 方案 的 第 二 部 分 使 用 GROUP BY 
GROUP BY 使 得 像 AVG 这 样 的 聚合 函数 


AVG 函数 会 忽略 Null, FE 


兴趣 的 列 执行 AVG 函数 即 可 ， 而 且 不 需要 使 用 GROUP 
i 的 例子 演示 了 Null 被 忽略 之 后 的 结果 。 














select distinct 30/2 


select distinct 30/3 


from t2 














。 如 果 是 Null, Wi SAL 的 值 为 9， 
函数 的 时 候 ， 一 定 要 先 想 一 下 如 何 处 











聚合 





(第 3 行 ) 依据 部 门 从 属 关系 把 员工 数据 分 为 若干 组 。 
自动 为 每 一 个 分 组 返回 一 个 结果 。 本 例 中 ，AVG 函数 





将 针对 按照 部 门 分 组 后 的 每 一 组 员工 数据 进行 计算 。 
顺便 说 一 下 ， 不 一 定 非 要 把 GROUP BY 列 放 到 SELECT 列表 里 。 来 看 下 面 这 个 例子 。 


select avg(sal) 
from emp 
group by deptno 


AVG(SAL) 


2916.66667 
2175 
1566.66667 


尽管 DEPTN0 没有 被 放 在 SELECT FAY 








入 SELECT 子 句 通常 有 助 于 提高 可 读 性 
子 句 里 没有 的 列 放 入 SELECT 列表 。 


有 ， 但 是 我 们 仍然 按照 该 列 分 组 。 把 用 于 分 组 的 列 放 
， 但 这 并 不 是 必需 的 。 反 之 则 不 然 ， 不 能 把 GROUP BY 





A 
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4. 参考 资料 
附录 A 能 帮 你 复习 与 GROUP BY 相关 的 知识 。 


72 查找 最 小 值 和 最 大 值 


1. 问题 

你 想 查 找 指定 列 的 最 大 值 和 最 小 值 。 例 如 ， 你 希望 找 出 全 体 员 工 的 最 高 工资 和 最 低 工资 ， 
以 及 每 个 部 门 的 最 高 工资 和 最 低 工 资 。 

2. 解决 方案 
要 查找 全 体 员 工 的 最 低 工 资 和 最 高 工资 ， 只 需要 分 别 使 用 MIN 函数 和 MAX 函数 即 可 。 


1 select min(sal) as min_sal, max(sal) as max_sal 
2 from emp 

















MIN SAL MAX_SAL 


为 了 查找 每 个 部 门 里 的 最 低 工 资 和 最 高 工资 ， 需 要 使 用 GROUP BY FAJ, MIN 函数 和 MAX 
国 数 。 
1 select deptno, min(sal) as min_sal, max(sal) as max_sal 


2 from emp 
3 group by deptno 





DEPTNO MIN_SAL MAX_SAL 


10 1300 5000 
20 800 3000 
30 950 2850 


3. 讨论 
为 了 找到 最 小 值 或 者 最 大 值 ， 并 且 把 整个 表 视 为 一 个 分 组 ， 只 需要 针对 感 兴趣 的 列 分 别 使 
用 MIN 函数 或 MAX 函数 即 可 ， 不 需要 使 用 GROUP BY FAJ, 

注意 ，MIN 函数 和 MAX 函数 会 忽略 NtL， 而 我 们 可 能 会 遇 到 Null 分组， 也 可 能 会 在 一 个 分 
组 里 遇 到 Null 值 。 在 下 面 的 查询 中 ，GROUP BY 查询 的 结果 里 有 两 个 分 组 (DEPTNO 分 别 等 于 
10 和 30) 会 返回 Null fü, 



































select deptno, comm 
from emp 

where deptno in (10,30) 
order by 1 


DEPTNO COMM 


30 300 





数值 处 理 | 141 





30 
30 0 
30 1300 
30 


select min(comm), max(comm) 
from emp 


MIN(COMM)  MAX(COMM) 


select deptno, min(comm), max(comm) 
from emp 
group by deptno 


DEPTNO MIN(COMM)  MAX(COMM) 


30 0 1300 


正如 附录 A 所 指出 的 ， 即 使 SELECT 子 句 里 只 有 聚合 国 数 ， 我 们 仍然 能 按照 表 中 的 其 他 列 
分 组 ， 如 下 所 示 。 
select min(comm), max(comm) 


from emp 
group by deptno 














MIN(COMM)  MAX(COMM) 


尽管 DEPTNO 不 在 SELECT 子 句 里 ， 我 们 仍然 按照 它 分 组 。 把 用 于 分 组 的 列 放 入 SELECT F 
句 通常 有 助 于 提高 可 读 性 ， 但 这 并 不 是 必需 的 。 反 之 ， 对 于 含有 GROUP BY 的 查询 而 言 ， 
SELECT 列表 里 的 列 必 须 同 时 出 现在 GROUP BY 子 句 里 。 

4. 参考 资料 

附录 A 能 帮 你 复习 与 GROUP BY 相关 的 知识 。 


7.3 KFA 























1. 问题 

对 所 有 值 求 和 ， 例 如 ， 计 算 全 体 员工 的 工资 总 和 。 

2. 解决 方案 

针对 整个 表 求 和 时 ， 只 要 对 感 兴趣 的 列 执行 SUM 函数 即 可 ， 不 需要 使 用 GROUP BY 子 句 。 


1 select sum(sal) 
2 from emp 





-A 
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SUM(SAL) 


如 果 把 数据 分 为 多 组 ， 就 需要 使 用 SUM 函数 和 GROUP BY 子 句 。 下 面 的 例子 按照 部 门 计算 员 


工 的 工资 总 额 。 


1 select deptno, sum(sal) as total_for_dept 


2 from emp 
3 group by deptno 


DEPTNO TOTAL_FOR_DEPT 


10 8750 
20 10875 
30 9400 


3. 讨论 








当 计 算 各 部 门 的 工资 总 额 时 ， 其 实 是 在 对 数 所 








避 进 行 分 组 。 对 于 每 个 部 门 而 言 ， 所 有 员工 的 


工资 会 被 相 加 ， 并 得 出 总 和 。 本 例 是 一 个 用 SQL 做 聚合 运算 的 例子 ， 因 为 重点 关注 的 不 是 
某 个 员工 的 工资 这 样 的 详细 信息 ， 而 是 各 个 部 门 的 工资 总 额 。 注 意 ，SUM 函数 会 忽略 Null, 
但 是 我 们 可 能 会 遇 到 Null 分 组 ， 下 面 的 例子 会 展示 这 一 点 。DEPTN0O 为 10 的 员工 都 没有 业 
务 提 成 ， 因 而 对 于 DEPTNO 等 于 10 的 分 组 而 言 ， 计 算 COMM 的 总 和 会 返回 Null, 











select deptno, comm 


from emp 
where deptno in (10,30) 
order by 1 
DEPTNO COMM 
10 
10 
10 
30 300 
30 500 
30 
30 0 
30 1300 
30 


select sum(comm) 
from emp 


SUM(COMM) 


select deptno, sum(comm) 
from emp 

where deptno in (10,30) 
group by deptno 
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DEPTNO SUM(COMM) 


4. 参考 资料 
附录 A 能 帮 你 复习 与 GROUP BY 相关 的 知识 。 


7.4 计算 行 数 


1. 问题 

计算 一 个 表 的 总 行 数 ， 或 者 计算 某 列 中 值 的 个 数 。 例 如 ， 和 希望 知道 员工 总 数 和 各 部 门 的 员 
工人 数 。 

2. 解决 方案 





当 计 算 整 个 表 的 总 行 数 时 ， 只 需要 使 用 COUNT 函数 和 符号 * 即 可 。 


1 select count(*) 
2 from emp 


COUNT(*) 





如 果 把 数据 分 为 多 组 ， 就 需要 使 用 COUNT 函数 和 GROUP BY 子 句 。 


1 select deptno, count(*) 
2 from emp 
3 group by deptno 


DEPTNO COUNT(*) 


10 3 
20 5 
30 6 


3. 讨论 





计算 各 部 门 的 员工 人 数 的 时 候 ， 我 们 就 是 在 对 数据 进行 分 组 。 每 多 一 个 员工 ， 则 总 数 加 








一 ， 最 终 会 计算 出 各 个 部 门 的 员工 人 数 。 本 例 使 用 了 SQL 做 聚合 运算 ， 因 





为 重点 关注 的 不 


是 诸如 某 个 员工 的 工资 或 职位 这 样 的 详细 信息 ， 而 是 各 个 部 门 的 员工 人 数 。 注 意 ， 当 把 列 
名 称 作为 参数 的 时 候 ，COUNT 函数 会 忽略 NtL。 使 用 符号 * 或 者 常量 参数 的 时 候 ， 就 会 包 





含 NuLL， 考 虑 下 面 的 例子 。 


select deptno, comm 











from emp 
DEPTNO COMM 
20 
30 300 
30 500 





30 1300 


select count(*), count(deptno), count(comm), count('hello') 
from emp 


COUNT(*) COUNT(DEPTNO) COUNT(COMM) COUNT('HELLO') 


select deptno, count(*), count(comm), count( 'hello') 
from emp 
group by deptno 


DEPTNO — COUNT(*) COUNT(COMM) COUNT('HELLO') 


10 3 0 3 
20 5 0 5 
30 6 4 6 








如 果 参 数列 的 值 都 为 NNLL， 或 者 表 里 没 有 任何 数据 ，COUNT 函数 就 会 返回 6。 请 注意 ， 即 
使 SELECT 子 句 里 只 有 聚合 国 数 ， 我 们 仍然 可 以 按照 其 他 列 对 表 中 的 数据 进行 分 组 ， 如 下 
所 示 。 

select count(*) 


from emp 
group by deptno 











COUNT(*) 





注意 ， 尽 管 DEPTNO 不 存在 于 SELECT 列表 里 ， 我 们 仍然 按照 该 列 进行 分 组 。 把 用 于 分 组 的 
列 放 入 SELECT 子 句 通常 有 助 于 提高 可 读 性 ， 但 这 并 不 是 必需 的 。 反 之 ， 如 果 某 列 被 放 入 了 
SELECT 列表 ， 那 么 我 们 就 必须 保证 它 也 存在 于 GROUP BY FAE, 
4. 参考 资料 

附录 A 能 帮 你 复习 与 GROUP BY 相关 的 知识 。 
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7.5 计算 非 NuLL 值 的 个 数 





1. 问题 

计算 某 一 列 里 非 Null 值 的 个 数 。 例 如 ， 和 希望 知道 有 多 少 名 员工 获得 了 业务 提成 。 
2. 解决 方案 

计算 EMP 表 的 COMM 列 里 非 Null 值 的 个 数 。 

















select count(comm) 
from emp 


COUNT ( COMM) 


3. 讨论 

当 执 行 COUNT(*) 操作 时 ， 实 际 上 是 在 统计 行 数 (而 不 会 去 管 实际 的 值 是 什么 ， 这 就 是 为 什 
Z, Null 值 和 非 Null 值 都 会 被 计 入 总 数 )。 但 是 ， 如 果 针 对 某 一 列 执行 COUNT 操作 ， 我 们 却 
是 在 计算 该 列 非 Null 值 的 个 数 。 前 一 个 实例 的 “讨论 ”部 分 提 到 了 这 种 区 别 。 在 本 解决 方 
案 中 ，COUNT(COMM) 返回 的 是 COMM 列 非 Null 值 的 个 数 。 因 为 只 有 获得 业务 提成 的 员工 才 会 
在 对 应 的 COMM 列 有 非 Null 值 ， 所 以 COUNT(COMM) 的 计数 结果 就 是 这 一 类 员工 的 总 数 。 


76 RIKA 


1. 问题 

你 想 针 对 某 一 列 进行 累计 求 和 。 
2. 解决 方案 
作为 示例 ， 下 面 的 解决 方案 将 介绍 如 何 计算 全 体 员 工 工资 的 累计 额 。 为 了 便于 理解 ， 查 询 
结果 按照 SAL 列 排序 ， 这 样 很 容易 观察 累计 和 的 增长 。 

DB2 和 Oracle 

使 用 SUM 函数 的 窗口 函数 版 本 进行 累计 求 和 。 






























































1 select ename, sal, 

2 sum(sal) over (order by sal,empno) as running_total 
3 from emp 

4 order by 2 

ENAME SAL RUNNING_TOTAL 
SMITH 800 800 
JAMES 950 1750 
ADAMS 1100 2850 
WARD 1250 4100 
MARTIN 1250 5350 
MILLER 1300 6650 
TURNER 1500 8150 





ALLEN 
CLARK 
BLAKE 
JONES 
SCOTT 
FORD 

KING 


1600 
2450 
2850 
2975 
3000 
3000 
5000 


9750 
12200 
15050 
18025 
21025 
24025 
29025 


MySQL, PostgreSQL 和 SQL Server 
祭 量 子 查询 来 进行 累计 求 和 (而 不 是 使 用 如 SUM OVER 这 样 的 窗口 函数 ， 因 为 不 能 像 
DB2 和 Oracle 的 解决 方案 那样 方便 地 按照 SAL 列 对 结果 集 排序 )。 最 终 的 累计 和 是 正确 的 
i 的 DB2 和 Oracle 解决 方案 的 结果 一 致 )， 但 是 中 间 结 果 因 为 缺 


使 用 


(最 后 一 行 的 合计 什 














与 前 下 











少 了 排序 操作 而 不 尽 相同 。 


1 
2 
3 
4 
5 


select e.ename, e.sal, 
(select sum(d.sal) from emp d 








where d.empno <= e.empno) as running total 


from emp e 
order by 3 


SAL 


RUNNING TOTAL 


3. 讨论 


使 用 新 的 ANSI 窗 











口 函 数 很 容易 进行 累计 求生 


H 
































。 对 于 尚未 支持 窗 




















口 函数 的 数据 库 管理 系统 








而 言 ， 必 须 使 用 标量 子 查 询 (通过 一 个 具有 唯一 值 的 字段 做 连接 查询 )。 


DB2 和 Oracle 
使 用 窗口 函数 SUM OVER 很 容易 进行 累计 求 和 。 上 述 解决 方案 使 用 的 ORDER BY 子 句 的 后 面 不 
I SAL 列 ， 还 有 EMPNO 列 (该 列 是 主键 ) ， 这 是 为 了 防止 累计 求 和 过 程 中 出 现 重 复 值 。 以 
下 示例 中 的 RUNNING_TOTAL2 列 展 示 了 重复 值 会 导致 什么 样 的 问题 。 


select 


from 
order 


empno, sal, 
sum(sal)over(order by sal,empno) as running_totall, 
sum(sal)over(order by sal) as running_total2 


emp 
by 2 
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ENAME SAL RUNNING_TOTAL1 RUNNING_TOTAL2 


SMITH 800 800 800 
JAMES 950 1750 1750 
ADAMS 1100 2850 2850 
WARD 1250 4100 5350 
MARTIN 1250 5350 5350 
MILLER 1300 6650 6650 
TURNER 1500 8150 8150 
ALLEN 1600 9750 9750 
CLARK 2450 12200 12200 
BLAKE 2850 15050 15050 
JONES 2975 18025 18025 
SCOTT 3000 21025 24025 
FORD 3000 24025 24025 
KING 5000 29025 29025 


员工 WARD, MARTIN, SCOTT 和 FORD 对 应 的 RUNNING TOTAL2 是 不 正确 的 。 这 是 因 
为 他 们 的 工资 在 EMP 表 里 出 现 了 不 止 一 次 ， 而 这 些 重复 值 也 被 计算 到 累计 和 中 。 这 就 是 为 
什么 必须 把 EMPN0 列 〈 它 是 唯一 的 ) 加 入 排序 项 ， 才 能 得 到 正确 的 计算 结果 ， 即 RUNNING. 
TOTAL1。 考 虑 这 样 一 种 情况 : 对 于 ADAMS, RUNNING TOTAL1 和 RUNNING TOTAL2 两 列 都 是 
2850, 2850 加 上 WARD 的 工资 1230， 应 该 得 到 4100， 然 而 RUNNING_TOTAL2 返回 的 却 是 
5350。 这 是 为 什么 呢 ? 因为 WARD 和 MARTIN 的 工资 相同 ， 这 两 个 1250 相 加 得 到 2500, 
再 加 上 2850 就 是 WARD 和 MARTIN 这 两 行 对 应 的 5350。 通 过 把 若干 列 组 合 起 来 作为 排 
序列 ， 能 够 避免 出 现 重 复 值 (例如 ，SAL 和 EMPNO 的 组 合 是 唯一 的 ) ， 这 样 就 能 保证 得 到 正 
确 的 累计 和 。 


MySQL、PostgreSQL 和 SQL Server 
因为 这 些 数 据 库 管理 系统 尚未 完全 支持 窗口 函数 ， 所 以 我 们 只 能 通过 标量 子 查 询 来 计算 累 
计 和 。 必 须 通 过 一 个 有 唯一 值 的 列 做 连接 查询 ， 否 则 ， 如 果 两 个 员工 的 工资 相同 ， 那 么 得 
到 的 累计 和 就 是 错误 的 。 对 于 本 实例 而 言 ， 关 键 在 于 把 D.EMPNO 和 E.EMPNO 连接 起 来 ， 并 
针对 每 个 小 于 或 者 等 于 E.EMPNO 的 D. EMPNO 计算 出 对 应 的 D.SAL。 如 果 把 标量 子 查询 改写 成 
一 个 EMP 表 全 体 数 据 与 部 分 数据 之 间 的 连接 查询 ， 会 更 加 容易 理解 这 一 点 。 

select e.ename as enamel, e.empno as empnol, e.sal as sall, 

d.ename as ename2, d.empno as empno2, d.sal as sal2 
from emp e, emp d 


where d.empno <= e.empno 
and e.empno = 7566 

















































































































ENAME EMPNO1 SAL1 ENAME EMPNO2 SAL2 
JONES 7566 2975 SMITH 7369 800 
JONES 7566 2975 ALLEN 7499 1600 
JONES 7566 2975 WARD 7521 1250 
JONES 7566 2975 JONES 7566 2975 




















EMPNO2 列 中 的 每 一 个 值 都 会 和 EMPNO1 列 中 对 应 的 值 进行 比较 。 如 果 EMPNO2 列 中 的 值 小 于 
或 者 等 于 EMPN01 列 中 对 应 的 值 ， 则 其 对 应 的 SAL2 列 的 值 会 被 计 入 总 和 。 对 于 上 述 查 询 而 
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=, RI SMITH, ALLEN, WARD fil JONES 的 EMPNO 值 会 和 JONES 的 EMPNO 值 相 比较 。 
由 于 四 个 员工 的 EMPNO 值 都 满足 小 于 或 者 等 于 JONES 的 EMPNO 值 这 一 条 件 ， 因 此 他 们 的 
工资 都 会 被 计 入 总 和 。 反 之 ，( 在 上 述 查 询 中) 任何 EMPNO [EKF JONES 的 EMPNO 值 的 
员工 ， 其 工资 都 不 会 被 计 入 总 和 。 对 于 完整 的 查询 而 言 ， 其 工作 方式 也 是 同样 的 ， 如 果 
EMPNO 值 小 于 或 者 等 于 全 表 的 最 大 值 7934 (MILLER 的 EMPNO 值 ) ， 则 其 对 应 的 工资 就 会 
被 计 入 总 和 。 


7.7 计算 累计 乘积 


1. 问题 
你 想 计 算 某 个 数值 列 的 累计 乘积 。 这 个 操作 类 似 于 上 一 个 实例 ， 只 不 过 不 使 用 加 法 ， 而 改 
用 乘法 。 
2. 解决 方案 
例如 ， 你 想 计 算 员 工 工 资 的 累计 乘积 。 虽 然 工 资 的 累计 乘积 可 能 用 处 不 大 ， 但 同样 的 方法 
也 能 方便 地 应 用 于 其 他 更 有 用 的 领域 。 
DB2 和 Oracle 
使 用 窗口 函数 SUM OVER， 并 利用 对 数 来 模拟 乘法 。 

1 select empno,ename,sal, 

2 exp(sum(ln(sal))over(order by sal,empno)) as running_prod 


3 from emp 
4 where deptno = 10 












































































































































EMPNO ENAME SAL RUNNING PROD 
7934 MILLER 1300 1300 
7782 CLARK 2450 3185000 
7839 KING 5000 15925000000 














不 能 使 用 SQL 计算 负数 和 零 的 对 数 。 如 果 表 里 有 这 样 的 值 ， 应 该 避免 把 它们 传递 给 SQL 
的 LN 国 数 。 为 了 便于 理解 ， 本 解决 方案 并 没有 针对 这 些 值 和 Null 做 防范 处 理 ， 但 是 在 真 
实 环境 下 ， 你 应 该 考虑 在 代码 中 添加 防范 措施 。 如 果 你 一 定 要 处 理 负数 和 零 ， 那 么 该 解决 
方案 可 能 不 适用 。 
还 有 一 个 只 适用 于 Oracle 的 解决 方案 ， 那 就 是 使 用 Oracle Database 10g 开始 支持 的 MODEL 
子 句 。 在 下 面 的 例子 里 ，SAL 列 中 的 每 一 个 值 都 会 被 转换 成 负数 ， 这 是 为 了 证 明 负 数 不 会 
给 计算 累计 乘积 带 来 任何 问题 。 

1 select empno, ename, sal, tmp as running_prod 

2 from ( 

3 select empno,ename,-sal as sal 

from emp 


4 
5 where deptno=10 
6 ) 
7 
8 

















































































































model 
dimension by(row_number() over(order by sal desc) rn ) 
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measures(sal, 0 tmp, empno, ename) 
rules ( 
tmp[any] = case when sal[cv()-1] is null then sal[cv()] 
else tmp[cv()-1]*sal[cv()] 


end 
) 
ENAME SAL RUNNING PROD 
MILLER -1300 -1300 
CLARK -2450 3185000 
KING -5000 -15925000000 


MySQL, PostgreSQL 和 SQL Server 
我 们 仍然 需要 使 用 对 数 求 和 ， 但 是 这 些 数据 库 不 支持 窗口 国 数 ， 因 而 改 用 标量 子 查 询 。 


1 
2 
3 
4 
5 
6 
7 


EMPNO 
7782 
7839 
7934 


























select e.empno,e.ename,e.sal, 


(select exp(sum(ln(d.sal))) 
from emp d 
where d.empno <= e.empno 
and e.deptno-d.deptno) as running prod 


from emp e 
where e.deptno-10 


ENAME SAL RUNNING PROD 
CLARK 2450 2450 
KING 5000 12250000 
MILLER 1300 15925000000 


对 于 SQL Server 而 言 ， 还 需要 用 LoG 函数 来 替代 LN 函数 。 


3. 讨论 
ER T DORT 





HF Oracle Database 10g 及 其 后 续 版 本 的 MODEL 子 句 ， 另 外 两 个 解决 方案 都 使 用 


了 下 面 的 把 两 个 数字 累加 的 做 法 : 


(1) 计算 它们 各 自 的 自然 对 数 ， 

(2) 把 上 述 自然 对 数 的 计算 结果 累加 起 来 ，; 

(3) 把 上 述 累 加 结果 作为 指数 ， 以 数学 常量 e 为 底数 ， 进 行 寡 运算 (使 用 EXP 函数 )。 
注意 ， 上 述 做 法 不 适用 于 零 和 负数 的 累计 ， 因 为 SQL 的 对 数 函 数 不 支 持 小 于 或 等 于 零 


的 值 。 











DB2 和 Oracle 
关于 窗口 函数 SUM OVER 的 工作 原理 ， 请 参考 前 一 个 实例 的 相关 内 容 。 


对 于 Oracle Database 10g 及 其 后 续 版 本 ， 可 以 使 用 MODEL 子 句 来 计算 累计 乘积 。 使 用 MODEL 
子 句 和 窗口 函数 Ron_NUMBER， 很 容易 找到 当前 行 的 前 一 行 。 可 以 像 访问 数组 一 样 访问 


MEASURES 列表 的 每 一 项 ， 也 可 以 使 用 DIMENSIONS 列表 的 项 (BU Row NUMBER 国 数 的 返回 值 ， 


别名 为 RN) 






































来 查找 数组 。 





select empno, ename, sal, tmp as running_prod,rn 
from ( 
select empno,ename,-sal as sal 
from emp 
where deptno=10 
) 
model 
dimension by(row_number() over(order by sal desc) rn ) 
measures(sal, 0 tmp, empno, ename) 


rules () 

EMPNO ENAME SAL RUNNING PROD RN 
7934 MILLER -1300 0 1 
7782 CLARK -2450 0 2 
7839 KING -5000 0 3 


我 们 看 到 SAL[1] 的 值 是 -1300。 由 于 数字 从 1 开始 连续 增加 ， 因 此 能 通过 把 行 号 减 去 一 来 
访问 前 一 行 。RULES 子 句 如 下 所 示 。 
rules ( 
tmp[any] = case when sal[cv()-1] is null then sal[cv()] 


else tmp[cv()-1]*sal[cv()] 
end 





) 


使 用 内 置 运算 符 ANY 可 以 遍历 每 一 行 ， 而 无 须 硬 编 码 。 在 这 个 例子 里 ，ANY 会 被 分 别 赋 
值 为 1、2 和 3。TMP[n] 的 初始 值 为 0。 通 过 评估 当前 的 值 (cv 函数 返回 当前 值 ) 来 决定 
TMP[n] 的 值 。TMP[1] 的 初始 值 为 0， 而 SAL[1] 是 -1300。 因 为 SAL[0] 不 存在 ， 所 以 TMP[1] 
被 设置 为 SAL[1]。 设 置 好 TMP[1] 后 ， 下 一 行 是 TMP[2]。SAL[1] 会 被 评估 (SAL[CVO)-1] 是 
SAL[1]， 因 为 ANY 的 当前 值 是 2)。SAL[1] 不 是 NNLL， 它 的 值 为 -1300， 因 而 TMP[2] 就 是 
TMP[1] 和 SAL[2] 的 乘积 。 以 此 类 推 ， 直 至 完成 所 有 行 的 计算 。 


MySQL、PostgreSQL 和 SQL Server 

请 参考 前 一 个 实例 里 针对 MySQL、PostgreSQL 和 SQL Server 解决 方案 的 标量 子 查询 的 
解释 。 

注意 ， 基 于 子 查询 的 解决 方案 得 到 的 输出 结果 与 Oracle 和 DB2 解决 方案 的 略 有 不 同 ， 这 
是 由 于 多 了 针对 EMPN0 列 的 比较 运算 (累计 乘积 以 一 种 不 同 的 顺序 被 计算 出 来 )。 类 似 于 累 
计 求 和 的 做 法 ， 标 量子 查询 驱动 了 乘积 的 累计 ， 基 于 子 查 询 的 解决 方案 按照 EMPNO 列 对 数 
据 进 行 排序 ， 而 在 Oracle 和 DB2 解决 方案 里 则 按照 SAL 列 排 序 。 


7.8 计算 累计 差 


1. 问题 
计算 某 个 数值 列 的 累计 差 。 例 如 ， 和 希望 计算 DEPTO 等 于 10 的 部 门 里 员工 工资 的 累计 差 ， 
并 且 得 到 如 下 所 示 的 结果 集 。 
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ENAME SAL RUNNING_DIFF 


MILLER 1300 1300 
CLARK 2450 -1150 
KING 5000 -6150 
2. 解决 方案 
DB2 和 Oracle 


使 用 窗口 函数 SUM OVER 计算 累计 差 。 


select ename,sal, 
sum(case when rn = 1 then sal 


else -sal end) 


over(order by sal,empno) as running_diff 


from ( 


row_number() over(order by sal,empno) as rn 


from emp 
where deptno = 10 


1 

2 

3 

4 

5 select empno,ename,sal, 
6 

7 

8 

9 ) x 


MySQL. PostgreSQL 和 SQL Server 
使 用 标量 子 查询 计算 累计 差 。 





1 select a.empno, a.ename, a.sal, 

2 (select case when a.empno = min(b.empno) then sum(b.sal) 
3 else sum(-b.sal) 

4 end 

5 from emp b 

6 where b.empno <= a.empno 

7 and b.deptno = a.deptno ) as rnk 

8 from emp a 

9 where a.deptno = 10 


3. 讨论 


本 实例 的 解决 方案 和 7.6 节 的 类 似 。 唯 一 的 不 同 之 处 在 于 SAL 的 结果 都 是 负数 ， 当 然 第 一 
行 除外 (本 例 把 DEPTNO 等 于 10 的 第 一 个 SAL 值 作为 起 点 ) 。 


7.9 计算 众 数 


1. 问题 
需要 找 出 某 一 列 的 众 数 〈 即 在 一 组 数据 里 上 








上 现 次 数 最 多 的 那个 数 )。 例 如 ， 和 希望 找 出 


DEPTNO 等 于 20 的 部 门 里 员工 工资 的 众 数 。 就 如 下 示例 而 言 ， 众 数 为 3000。 





select sal 

from emp 

where deptno = 20 
order by sal 





2975 

















3000 
3000 
2. 解决 方案 
DB2 和 SQL Server 
使 用 窗口 函数 DENSE_RANK 对 工资 值 出 现 的 次 数 进 行 排序 ， 以 帮助 我 们 找到 众 数 。 
1 select sal 
2 from ( 
3 select sal, 
4 dense_rank() over(order by cnt desc) as rnk 
5 from ( 
6 select sal, count(*) as cnt 
8 from emp 
9 where deptno = 20 
10 group by sal 
11 ) x 
12 ) y 
13 where rnk = 1 
Oracle 

















对 于 Oracle 8; 来 说 ， 可 以 使 用 DB2 的 解决 方案 。 如 果 你 使 用 的 是 Oracle 9i 及 其 后 续 版 本 ， 
可 以 使 用 聚合 函数 MAX 的 KEEP 扩展 来 找到 SAL 列 的 众 数 。 注 意 ， 如 果 有 多 个 众 数 ， 则 KEEP 


解决 方 








案 只 会 保留 工资 值 最 高 的 那个 。 如 果 希 望 看 到 全 部 众 数 ， 就 需要 修改 该 解决 方案 ， 


或 者 改 用 前 面 的 DB2 解决 方案 。 在 本 例 中 ， 因 为 3000 是 DEPTN0 等 于 20 的 部 门 里 SAL 列 


的 众 数 ， 并 且 也 是 SAL 列 的 最 大 值 ， 所 以 下 面 的 解决 方案 足以 胜任 。 


1 
2 
3 
4 
5 
6 
7 
8 





c 











T 





select max(sal) 


keep(dense rank first order by cnt desc) sal 
from ( 


select sal, count(*) cnt 


from emp 
where deptno-20 
group by sal 
) 


MySQL 和 PostgreSQL 
使 用 子 查 询 查找 众 数 。 


1 
2 
3 
4 
5 
6 
7 
8 


3. 讨论 


select sal 


from emp 
where deptno = 20 
group by sal 


having count(*) >= all ( select count(*) 


from emp 
where deptno = 20 
group by sal ) 


DB2 和 SQL Server 
X 返 回 每 一 个 SAL EKERI ORG, ARAE v 使 用 窗口 函数 DENSE_RANK (该 


ARRI 








EE 
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数 允 许 出 现 排名 相同 的 状况 ) 对 查询 结果 进行 排序 。 
询 结果 按照 每 一 个 SAL 值 的 出 现 次 数 进行 排序 ， 如 下 所 示 。 





Ut Es 





1 select sal, 

2 dense_rank()over(order by cnt desc) as rnk 
3 fronm ( 

4 select sal,count(*) as cnt 

5 from emp 

6 where deptno = 20 

7 group by sal 

8 ) x 





最 外 层 的 查询 只 是 简单 地 筛选 出 RNK 等 于 1 的 行 。 
Oracle 
内 嵌 视 图 返回 每 一 个 SAL 值 及 其 出 现 的 次 数 ， 如 下 所 示 。 
select sal, count(*) cnt 
from emp 


where deptno=20 
group by sal 








SAL CNT 
800 1 
1100 1 
2975 1 
3000 2 





然后 利用 聚合 函数 MAX 的 KEEP 扩展 找到 众 数 。 下 面 的 KEEP 子 句 包含 DENSE RANK, FIRST 和 
ORDER BY CNT DESC 三 个 部 分 。 


keep(dense_rank first order by cnt desc) 


这 样 做 很 容易 查找 众 数 。KEEP 子 句 会 查看 内 骨 视 图 返回 的 CNT 值 ， 并 决定 哪 一 个 SAL fH 
会 被 MAX 函数 返回 。 按 照 从 右 向 左 的 执行 顺序 ， 所 有 的 CNT 值 先 按照 降序 排列 ， 然 后 执 
行 DENSE RANK 函数 ， 并 保留 排 在 第 一 位 的 CNT 值 。 仔 细 观 察 内 艇 视图 查询 结果 ， 可 以 发 现 
3000 对 应 的 CNT 是 2， 在 查询 结果 中 是 最 大 的 。MAX(SAL) 的 返回 值 是 最 大 的 SAL 值 ， 而 且 
其 对 应 的 CNT 值 也 是 最 大 的 ， 本 例 中 是 3000。 


4. 参考 资料 
11.11 节 对 Oracle 聚合 函数 的 KEEP 扩展 有 更 深入 的 讨论 。 


MySQL 和 PostgreSQL 
查询 返回 每 一 个 SAL 值 的 出 现 次 数 。 外 层 查询 返回 出 现 次 数 大 于 或 者 等 于 子 查询 全 部 

























































































返回 值 的 SAL (E 《也 就 是 说 ， 外 层 查 询 返回 DEPTN0 等 于 20 的 部 门 里 出 现 次 数 最 多 的 工 
资 值 ) 。 


7.30 计算 中 位 数 

1. 问题 

你 想 计算 某 个 数值 列 的 中 位 数 〈 即 按 顺 序 排列 的 一 组 数据 中 居于 中 间 位 置 的 数 )。 例 如 ， 
你 希望 知道 DEPTN0 等 于 20 的 部 门 里 员工 工资 的 中 位 数 。 就 如 下 示例 而 言 ， 中 位 数 为 
2975, 














select sal 

from emp 

where deptno - 20 
order by sal 


2. 解决 方案 

除了 Oracle 的 解决 方案 (Oracle 有 可 以 计算 中 位 数 的 函数 )， 其 他 解决 方案 都 基于 David 
Rozenshtein、Anatoly Abramovich 和 Eugene Birger 在 Optimizing Transact-SQL 一 书 中 记载 
的 方法 。 窗 口 国 数 的 出 现 使 得 我 们 有 了 比 传统 的 自 连 接 查询 更 为 高 效 的 做 法 。 

DB2 
使 用 窗口 函数 COUNT (*) OVER 和 ROW. NUMBER 查找 中 位 数 。 

















1 select avg(sal) 
2 from ( 
3 select sal, 
4 count(*) over() total, 
5 cast(count(*) over() as decimal)/2 mid, 
6 ceil(cast(count(*) over() as decimal)/2) next, 
7 row number() over (order by sal) rn 
8 from emp 
9 where deptno = 20 
10 ) x 
11 where ( mod(total,2) = 0 
12 and rn in ( mid, mid+1 ) 
13 ) 
14 or ( mod(total,2) - 1 
15 and rn = next 
16 ) 
MySQL 和 PostgreSQL 
使 用 自 连接 查询 查找 中 位 数 。 
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1 
2 
3 
4 
5 
6 
7 
8 
9 
0 


Oracle 
使 用 函数 MEDIAN (Oracle Database 10g) 或 者 PERCENTILE CONT (Oracle 9i), 


1 
2 
3 


1 
2 
3 
4 


select 
from 
select 
from 
where 
and 
group 
having 


avg(sal) 

( 

e.sal 

emp e, emp d 

e.deptno = d.deptno 

e.deptno = 20 

by e.sal 

sum(case when e.sal = d.sal then 1 else 0 end) 


>= abs(sum(sign(e.sal - d.sal))) 
) 


select median(sal) 
from emp 
where deptno=20 


select percentile_cont(0.5) 
within group(order by sal) 
from emp 
where deptno=20 


DB2 解决 方案 也 适用 于 Oracle 8i。 对 于 Oracle 8; 之 前 的 版 本 ， 就 要 采用 MySQL 和 PostgreSQL 


的 解决 方案 。 
SQL Server 
使 用 窗口 函数 COUNT (*) OVER 和 ROW. NUMBER 查找 中 位 数 。 
1 select avg(sal) 
2 from ( 
3 select sal, 
4 count(*) over() total, 
5 cast(count(*) over() as decimal)/2 mid, 
6 ceiling(cast(count(*)over() as decimal)/2) next, 
7 row_number() over(order by sal) rn 
8 from emp 
9 where deptno = 20 
10 ) x 
11 where ( total%2 = 0 
12 and rn in ( mid, mid+1 ) 
13 ) 
14 or ( total%2 = 1 
15 and rn = next 
16 ) 
3. 讨论 
DB2 和 SQL Server 


DB2 和 SQL Server 的 解决 方案 之 间 的 唯一 不 同 之 处 在 于 一 个 语法 细节 : SQL Server 的 取 
模 运 算 符 是 %，DB2 则 使 用 moD 函数 。 除 此 之 外 ， 二 者 并 无 二 致 。 内 骸 视 图 X 返 回 TOTAL, 
MID 和 NEXT 三 种 不 同 的 总 数 以 及 ROW, NUMBER 函数 生成 的 RN。 这 些 额 外 生成 的 列 有 助 于 查 
找 中 位 数 。 仔 细 观 察 内 岁 视 图 X 返回 的 结果 集 ， 并 看 看 这 些 列 表示 什么 。 
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A j == 


LN 


select 


from 
where 


sal, 

count(*) over() total, 

cast(count(*)over() as decimal)/2 mid, 
ceil(cast(count(*)over() as decimal)/2) next, 
row_number()over(order by sal) rn 

emp 

deptno = 20 


SAL TOTAL MID NEXT RN 





为 了 找到 中 位 数 ，SAL 列 的 值 必 须 按照 从 小 到 大 的 顺序 排列 。 由 于 DEPTNO 等 于 20 的 员工 
的 个 数 为 奇数 ， 因 此 中 位 数 就 是 RN 与 NEXT 相等 的 那 一 行 的 SAL [Ë (NEXT 表示 大 于 员工 总 


数 除 以 2 的 商 的 最 小 整数 )。 












































如 果 内 先 视 图 X 返 回 的 结果 集 的 行 数 为 奇数 ， 则 WHERE 子 句 的 前 半 部 分 (第 11 ~ 1347) 
不 会 命中 。 如 果 我 们 确信 内 风 视 图 Xx 返回 的 结果 集 的 行 数 始 终 是 奇数 ， 不 妨 简 化 为 如 下 的 


形式 。 


select 








avg(sal) 


from ( 


select 


from 
where 


where 


sal, 

count(*)over() total, 
ceil(cast(count(*)over() as decimal)/2) next, 
row_number()over(order by sal) rn 

emp 

deptno = 20 

) x 


rn = next 





不 幸 的 是 ， 如 果子 查询 返回 的 结果 集 的 行 数 为 偶数 ， 上 述 简化 的 做 法 不 再 适用 。 该 解决 方 
案 使 用 MID 列 来 处 理 偶 数 行 的 情况 。 如 果 DEPTNO 等 于 30, MARILE X 的 返回 结果 会 包 
含 6 个 员工 。 


select 


from 














sal, 

count(*)over() total, 

cast(count(*)over() as decimal)/2 mid, 
ceil(cast(count(*)over() as decimal)/2) next, 
row_number()over(order by sal) rn 

emp 


where deptno = 30 


SAL TOTAL MID NEXT RN 
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由 于 一 共有 偶数 行 数 据 ， 因 此 中 位 数 就 变 成 了 其 中 两 行 数 据 的 平均 值 ， 相 关 的 两 行 是 RN 
等 于 MID 的 那 一 行 以 及 RN 等 于 MID+1 的 那 一 行 。 


MySQL 和 PostgreSQL 

首先 通过 自 连接 EMP 表 来 计算 中 位 数 ， 自 连接 查询 会 返回 所 有 工资 值 的 笛 卡 儿 积 (但 是 针 
对 E.SAL 做 GROUP BY 之 后 会 去 掉 重 复 值 )。HAVING 子 句 使 用 SUM 函数 来 计算 E. SAL 和 D.SAL 
相等 的 次 数 。 如 果 它 们 相等 的 次 数 不 小 于 E.5AL 大 于 D.SAL 的 次 数 ， 则 对 应 的 行 就 是 中 位 
数 。 不 妨 把 SUM 函数 添加 到 SELECT 列表 中 ， 以 观察 查询 结果 ， 并 验证 这 一 点 。 


select e.sal, 
sum(case when e.sal=d.sal 
then 1 else 0 end) as cntl, 
abs(sum(sign(e.sal - d.sal))) as cnt2 
from emp e, emp d 
where e.deptno = d.deptno 
and e.deptno = 20 
group by e.sal 





















































SAL CNT1 CNT2 


Oracle 

对 于 Oracle Database 10g 或 者 Oracle 9i, "TUA f JH Oracle 中 的 函数 计算 中 位 数 。 对 于 
Oracle 8i， 不 妨 使 用 DB2 解决 方案 。 对 于 更 早 的 Oracle 版 本 ， 只 能 采用 PostgreSQL 解 
决 方案 。MEDIAN 函数 明显 是 用 于 计算 中 位 数 的 ， 而 PERCENTILE CONT 函数 的 用 途 看 起 来 
就 不 那么 直观 。 传 递 给 PERCENTILE_CONT 函数 的 参数 0.5 其 实 是 一 个 百 分 位 数值 。WITHIN 
GROUP (ORDER BY SAL) 子 句 会 生成 顺序 排列 的 行 数据 ， 以 便于 PERCENTILE CONT 函数 搜索 。 
(注意 ， 中 位 数 就 是 在 一 组 顺序 排列 的 数值 里 居于 中 间 位 置 的 那个 数 。) 最 后 的 返回 值 是 
顺序 排列 的 行 数据 里 落 入 指定 百 分 位 的 数值 (本 例 中 的 百 分 位 数值 是 0.5， 居 于 边界 值 0 
和 1 的 中 间 )。 


7.11 计算 百分比 


1. 问题 
你 想 知道 某 一 列 的 值 占 总 和 的 百分比 。 例 如 ， 你 希望 知道 DEPTNO 等 于 10 的 部 门 的 工资 占 
全 体 员工 工资 的 百分比 。 


2. 解决 方案 

总 体 而 言 ， 使 用 SQL 计算 百分比 和 在 纸 上 手 算 没 什么 不 同 。 只 需 先 做 除法 ， 再 做 乘法 即 
可 。 在 本 例 中 ， 要 计算 EM 表 中 DEPTNO 等 于 10 的 工资 额 占 总 体 的 百分比 。 先 算出 DEPTNO 
等 于 10 的 工资 总 额 ， 然 后 再 除 以 表 中 全 部 工资 的 总 额 ， 最 后 乘 以 100 以 得 到 一 个 代表 百 
分 比 的 值 。 







































































MySQL 和 PostgreSQL 
DEPTNO 等 于 10 的 工资 总 额 除 以 全 体 工资 总 额 。 


1 select (sum( 

2 case when deptno = 10 then sal end)/sum(sal) 
3 )*100 as pct 

4 from emp 


DB2, Oracle 和 SQL Server 
(EH ARRIE O KA SUM OVER 来 得 到 全 体 工 资 总 额 以 及 DEPTNO 等 于 10 的 工资 总 额 。 
然后 ， 在 外 层 查询 中 执行 除法 和 乘法 。 

















1 select distinct (d10/total)*100 as pct 

2 from ( 

3 select deptno, 

4 sum(sal)over() total, 

5 sum(sal)over(partition by deptno) d10 
6 from emp 

7 )x 

8 where deptno-10 


3. 讨论 
MySQL 和 PostgreSQL 
CASE 语句 很 容易 筛选 出 DEPTNO 等 于 10 的 工资 值 ， 把 这 些 数 加 起 来 就 可 以 得 到 工资 和 ， 然 
后 除 以 工资 总 和 。 因 为 聚合 函数 忽略 NNLL， 所 以 不 需要 在 CASE 语句 的 后 面 加 ELSE FA, 
为 了 清楚 地 看 到 除数 和 被 除数 ， 不 妨 先 去 掉 除 法 运算 ， 并 执行 如 下 的 查询 语句 。 

select sum(case when deptno = 10 then sal end) as d10, 


sum(sal) 
from emp 




















D10 SUM(SAL) 


执行 除法 运算 时 可 能 需要 加 入 显 式 的 类 型 转换 操作 ， 这 取决 于 SAL 列 的 类 型 。 例 如 ， 对 
于 DB2、SQL Server 和 PostgreSQL， 如 果 SAL 列 的 类 型 为 整 型 ， 可 以 将 其 转换 为 十 进 制 小 
数 ， 以 便于 得 到 正确 的 计算 结果 ， 如 下 所 示 。 


select (cast( 
sum(case when deptno - 10 then sal end) 
as decimal)/sum(sal) 
)*100 as pct 
from emp 























DB2, Oracle 和 SQL Server 
与 上 述 传统 的 做 法 不 同 ,下 面 的 解决 方案 使 用 窗口 函数 来 计算 百分比 。 对 于 DB2 和 SQL 
Server， 如 果 SAL 列 的 类 型 为 整 型 ， 需 要 在 进行 除法 运算 前 做 类 型 转换 。 
select distinct 
cast(d10 as decimal)/total*100 as pct 


from ( 
select deptno, 
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sum(sal)over() total, 
sum(sal)over(partition by deptno) d10 
from emp 
) x 
where deptno=10 


始终 要 记 住 的 一 点 是 ，WHERE 子 句 评估 完成 之 后 才 会 执行 窗口 函数 。 因 而 ， 不 能 将 过 滤 
DEPTNO 的 操作 放 到 内 骨 视 图 X 里 。 试 想 没 有 DEPTNO 过 滤 条 件 和 有 该 过 滤 条 件 ， 内 骨 视 图 X 
的 查询 结果 集 有 何 异同 。 首 先 来 看 看 没有 该 过 滤 条 件 的 结果 集 。 

select deptno, 


sum(sal)over() total, 
sum(sal)over(partition by deptno) d10 



































from emp 

DEPTNO TOTAL D10 
10 29025 8750 
10 29025 8750 
10 29025 8750 
20 29025 10875 
20 29025 10875 
20 29025 10875 
20 29025 10875 
20 29025 10875 
30 29025 9400 
30 29025 9400 
30 29025 9400 
30 29025 9400 
30 29025 9400 
30 29025 9400 








下 面 是 有 过 滤 条 件 的 结果 集 。 
select deptno, 
sum(sal)over() total, 
sum(sal)over(partition by deptno) d10 
from emp 
where deptno=10 











DEPTNO TOTAL D10 
10 8750 8750 
10 8750 8750 
10 8750 8750 


因为 要 先 评估 WHERE 子 句 再 执行 窗口 函数 ， 所 以 此 处 TOTAL 的 计算 结果 实际 上 只 是 DEPTNO 
等 于 10 的 员工 的 工资 和 。 但 是 ， 我 们 希望 TOTAL 等 于 全 体 员 工 的 工资 和 。 这 就 是 为 什么 
DEPTNO 的 过 滤 条 件 要 放 在 内 嵌 视 图 X 之 外 。 


7.12 聚合 NuLL 列 


1. 问题 
你 想 针 对 某 列 做 聚合 运算 ， 但 该 列 的 值 为 NNtL。 你 希望 保持 聚合 运算 结果 的 准确 性 ， 但 又 
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担心 察 合 函数 会 忽略 Null 值 。 例 如 ， 你 想 知 道 DEPTNO 等 于 30 的 员工 的 平均 业务 提成 ， 但 
部 分 员工 实际 上 没有 获得 提成 这 些 人 的 COM 列 是 Null), 5 ais 
会 被 忽略， 因此 输出 结果 的 准确 性 就 无 法 得 到 保证 。 总 之 ， 你 希望 聚合 运算 能 以 某 种 方式 
把 Null 值 也 包含 进去 。 

2. 解决 方案 

使 用 COALESCE 函数 把 Null 转换 为 0， 这 样 聚合 函数 就 能 处 理 它 们 了 。 


1 select avg(coalesce(comm,0)) as avg_comm 
2 from emp 
3 where deptno=30 
































3. 讨论 
使 用 聚合 函数 时 一 定 要 记 住 ，NutL 值 会 被 忽略 。 来 看 看 不 使 用 COALESCE 函数 的 输出 结果 。 


select avg(comm) 
from emp 
where deptno=30 

















AVG(COMM) 


上 述 查 询 结 果 显 示 ，DEPTNO 等 于 30 的 员工 的 平均 业务 提成 是 550， 但 如 果 快 速 查看 一 下 ， 
就 会 发 现实 际 情形 并 非 如 此 。 
select ename, comm 
from emp 


where deptno=30 
order by comm desc 


ENAME COMM 
BLAKE 

JAMES 

MARTIN 1400 
WARD 500 
ALLEN 300 
TURNER 0 


以 上 结果 集 显 示 ， 在 6 个 员工 中 ， 只 有 4 人 能 领取 业务 提成 。DEPTN0O 等 于 30 的 员工 的 提 
成 总 额 为 2200， 因 而 平均 值 应 该 是 2200/6， 而 不 是 2200/4。 如 果 不 使 用 COALESCE 国 数 ， 
我 们 实际 上 是 在 回答 这 样 一 个 问题 :“ 对 于 DEPTNO 等 于 30、 且 能 领取 业务 提成 的 员工 而 
言 ， 其 提成 平均 值 是 多 少 ? ”但 实际 上 我 们 要 回答 的 问题 却 是 :“ 对 于 DEPTO 等 于 30 的 全 
体 员工 而 言 ， 其 提成 平均 值 是 多 少 ? ”总 之 , 一定 要 记 住 的 是 ， 一旦 涉及 聚合 运算 ， 就 要 
相应 地 考虑 如 何 处 理 NuLL 值 。 


7.13 计算 平均 值 时 去 掉 最 大 值 和 最 小 值 


1. 问题 
你 想 计算 平均 值 ， 但 又 想 去 掉 最 大 值 和 最 小 值 ， 以 降低 它们 对 最 终 计算 结果 的 影响 。 例 
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如 ， 你 希望 先 去 掉 最 高 工资 和 最 低 工资 后 ， 再 计算 全 体 员 工 的 平均 工资 。 


2. 解决 方案 
MySQL 和 PostgreSQL 
使 用 子 查 询 去 掉 最 大 值 和 最 小 值 。 














1 select avg(sal) 

2 from emp 

3 where sal not in ( 

4 (select min(sal) from emp), 
5 (select max(sal) from emp) 
6 


) 
DB2, Oracle 和 SQL Server 
TE HND z] EJUS 3. I EFE MAX OVER 和 MIN OVER 来 生成 结果 集 ， 可 以 很 容易 去 掉 最 大 值 和 
最 小 值 。 




















1 select avg(sal) 

2 from ( 

3 select sal, min(sal) over()min_sal, max(sal)over() max_sal 

4 from emp 

5 ) x 

6 where sal not in (min sal,max sal) 

3. 讨论 

MySQL 和 PostgreSQL 

子 查 询 能 找到 最 高 和 最 低 的 工资 值 。 针 对 它们 使 用 NOT IN 之 后 ， 在 计算 平均 值 时 就 能 去 掉 
这 些 值 。 注 意 ， 如 果 有 重复 值 〈 例 如 ， 最 高 或 者 最 低 工资 对 应 的 员工 不 止 一 人 )， 那 么 所 
有 重复 值 都 将 被 过 滤 掉 。 如 果 希 望 只 去 掉 一 个 最 大 值 和 一 个 最 小 值 ， 只 需要 把 它们 从 合计 
值 里 先 减 掉 ， 再 做 除法 即 可 。 


select (sum(sal)-min(sal)-max(sal))/(count(*)-2) 
from emp 















































DB2. Oracle 和 SQL Server 
VSHECHLÉS. x 会 返回 全 部 工资 值 以 及 最 高 和 最 低 的 工资 值 。 


select sal, min(sal)over() min sal, max(sal)over() max sal 
from emp 





SAL | MIN SAL MAX SAL 


800 800 5000 
1600 800 5000 
1250 800 5000 
2975 800 5000 
1250 800 5000 
2850 800 5000 
2450 800 5000 
3000 800 5000 
5000 800 5000 
1500 800 5000 





1100 800 5000 


950 800 5000 
3000 800 5000 
1300 800 5000 

















在 以 上 的 查询 结果 中 ， 每 一 行 都 包含 最 高 和 最 低 的 工资 值 ， 因 而 查找 最 大 值 和 最 小 值 就 不 
是 问题 。 外 层 查 询 针 对 内 髓 视图 X 返回 的 行 又 做 了 一 次 过 滤 ， 这 样 一 来 ， 计 算 平均 值 之 前 
就 先 去 掉 了 与 MIN_SAL 或 者 MAX SAL 相等 的 工资 值 。 


` A r= 米 厅 r2 ra 4^ SL, Eh rA 
7.14 将 含有 字母 和 数字 的 字符 串 转 换 为 数字 
1. 问题 
你 有 字母 和 数字 混合 的 数据 ， 并 希望 提取 出 其 中 的 数字 部 分 。 例 如 ， 对 于 字符 串 
paul123f321， 你 想得到 的 结果 是 数字 123321。 
2. 解决 方案 
DB2 
使 用 函数 TRANSLATE 和 REPLACE 从 含有 字母 和 数字 的 字符 串 里 提取 出 数字 字符 。 






























































1 select cast( 

2 replace( 

3 translate( 'pauli23f321', 

4 repeat('4',26), 

5 'abcdefghijklmnoparstuvwxyz'), '&' ,'') 
6 as integer ) as num 

7 from ti 


Oracle 和 PostgreSQL 
使 用 函数 TRANSLATE 和 REPLACE 从 含有 字母 和 数字 的 字符 串 里 提取 出 数字 字符 。 











1 select cast( 

2 replace( 

3 translate( 'pauli23f321', 

4 'abcdefghijklmnopqrstuvwxyz', 
5 rpad( '#' ,26,'#')),'#','') 

6 as integer ) as num 
7 from ti 


MySQL 和 SQL Server 

在 写作 本 书 时 ， 这 两 个 数据 库 尚未 支持 TRANSLATE 函数 ， 因 而 无 法 提供 解决 方案 。 

3. 讨论 

两 种 解决 方案 的 唯一 区 别 是 语法 : DB2 使 用 的 是 REPEAT 函数 而 非 RPAD 函数 ， 并 且 TRANSLATE 
国 数 的 参数 列表 顺序 也 有 所 不 同 。 下 面 的 解释 内 容 以 Oracle 和 PostgreSQL 解决 方案 为 准 ， 
也 会 适当 兼顾 DB2 的 解决 方案 。 如 果 我 们 试 着 从 内 到 外 执行 查询 (从 TRANSLATE 开始 )， 
就 会 明白 整个 查询 其 实 不 难 。 首 先 ，TRANSLATE 函数 把 每 个 非 数 字 字 符 赫 换 为 #。 
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select translate( 'paul123f321', 
'abcdefghijklmnopqrstuvwxyz', 
rpad('#',26,'#')) as num 
from t1 


####123#321 


接着 ， 使 用 REPLACE 函数 删除 #， 最 后 再 把 剩余 的 部 分 转换 为 数值 类 型 即 可 。 这 个 例子 非 
常 简 单 ， 因 为 要 处 理 的 数据 是 一 个 只 包含 字母 和 数字 的 字符 串 。 如 果 该 字符 串 还 包含 其 他 
字符 ， 那 么 从 反面 着 手 可 能 会 更 容易 : 不 是 先 找到 非 数字 字符 并 删除 它们 ， 而 是 先 找到 数 
字 字 符 再 去 掉 其 他 字符 。 下 面 的 例子 展示 了 这 种 方法 。 


select replace( 
translate('paul123f321', 
replace(translate( 'paul123f321', 
'0123456789', 
rpad('#',10,'#')),'#',''), 
rpad('#',length('paul123f321'),'#')),'#','') as num 






























































from t1 


123321 





上 述 解决 方案 看 起 来 比 最 初 的 做 法 更 令 人 费解 ， 不 过 如 果 拆 开 来 看 ， 也 不 是 很 难 懂 。 我 们 
来 观察 最 内 层 的 TRANSLATE 函数 调用 。 
select translate( 'pauli23f321', 


'0123456789', 
rpad('#',10,'#')) 














from t1 


TRANSLATE( ' 


paul###f HHH 


一 步 就 不 同 : 它 没有 用 # 替换 非 数 字 字 符 ， 反 而 用 # 逐个 替换 全 部 数字 字符 。 下 一 步 删 
除 &， 这 样 就 具 币 下 非 数 字 字符 了 。 
select replace(translate( 'paul123f321', 


'0123456789', 
rpad '#' ,10, 8), 8','') 





from t1 














然后 再 次 调用 TRANSLATE 国 数 ， 用 # ERSUSCSETRERRCBLIJBUR HERCESETE (上 一 步 的 返回 结 
果 )。 





select translate('pauli23f321', 
replace(translate( 'pauli123f321', 
'0123456789', 
rpad('£',10,'4)), 8, ''), 
rpad('£',length('paul123f321'), '#' )) 
from t1 


TRANSLATE( ' 


1HHHET2 38321 


这 时 我 们 不 妨 停 下 来 ， 仔 细 观 察 最 外 层 的 TRANSLATE 函数 调用 。RPAD 函数 的 第 二 个 参 
数 (对 于 DB2 而 言 ， 是 REPEAT 国 数 的 第 二 个 参数 ) 是 原 字 符 串 的 长 度 。 这 是 一 种 巧妙 
的 用 法 ， 因 为 一 个 字符 串 里 任何 字符 的 出 现 次 数 都 不 会 超过 整个 字符 串 的 长 度 。 现 在 ， 
全 部 非 数字 字符 都 被 坎 换 成 了 #。 最 后 ， 调 用 REPLACE 国 数 去 掉 这 些 #， 因 此 最 终 就 只 剩 
下 数字 。 


7.15 ”修改 累计 值 


1. 问题 
你 想 依据 另 一 列 的 值 来 修改 累计 值 。 试 想 这 样 的 场景 : 你 希望 显示 一 个 信用 卡 账户 的 交易 
历史 ， 并 显示 每 一 笔 交 易 完成 后 的 余额 。 本 实例 将 会 用 到 如 下 所 示 的 视图 V。 


create view V (id,amt,trx) 
as 
select 1, 100, 'PR' from t1 union all 
select 2, 100, 'PR' from t1 union all 
select 3, 50, 'PY' from t1 union all 
select 4, 100, 'PR' from t1 union all 
5 
6 

















select 5, 200, 'PY' from t1 union all 
select 6, 50, 'PY' from t1 


select * from V 


ID AMT TRX 


ID 列 能 唯一 地 标示 每 一 笔 交 易 。AMT 列 代表 每 一 笔 交 易 涉 及 的 金额 (要 么 是 还 款 ， 要 么 是 
购物 )。TRX 列 定义 交易 的 类 型 : 还 款 是 PY， 购 物 是 PR。 如 果 TRX 的 值 是 PY， 你 希望 能 从 
累计 值 里 减 去 当前 的 AMT 值 。 如 果 TRX 的 值 是 PR， 你 希望 累计 值 加 上 当前 的 AMT 值 。 最 
终 ， 你 想得到 如 下 所 示 的 结果 集 。 


TRX_TYPE AMT BALANCE 






































PURCHASE 100 100 
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PURCHASE 100 200 


使 用 窗口 函数 SUM OVER 进行 累计 求 和 ， 并 使 用 CASE 表达 式 来 决定 交易 的 类 型 。 











表达 式 来 决定 交易 的 类 型 


!py' 


then -v2.amt else v2.amt 


PAYMENT 50 150 
PURCHASE 100 250 
PAYMENT 200 50 
PAYMENT 50 0 
2. 解决 方案 
DB2 和 Oracle 
1 select case when trx = 'PY' 
2 then 'PAYMENT' 
3 else 'PURCHASE' 
4 end trx_type, 
5 anmt, 
6 sum( 
7 case when trx = 'PY' 
8 then -amt else amt 
9 end 
10 ) over (order by id,amt) as balance 
11 from V 
MySQL, PostgreSQL 和 SQL Server 
使 用 标量 子 查 询 进 行 累 计 求 和 ， 并 使 用 CASE 
1 select case when vi.trx = 'PY' 
2 then 'PAYMENT' 
d else 'PURCHASE' 
4 end as trx type, 
5 v1.amt, 
6 (select sum( 
7 case when v2.trx - 
8 
9 end 
10 ) 
11 from V v2 
12 where v2.id <= v1.id) as balance 
13 from V vl 
3. 讨论 


CASE 表达 式 用 于 决定 是 把 当前 的 AMT 值 加 到 累计 




















值 。 如 果 交 易 类 型 是 还 款 ，AMT 值 会 被 变 为 负数 ， 


的 结果 如 下 所 示 。 


select case when trx = 'PY' 


then 'PAYMENT' 
else 'PURCHASE' 
end trx type, 


case when trx - 'PY' 
then -amt else amt 
end as amt 
from V 








=o 


直 中 ， 还 是 从 累计 值 中 减 去 当前 的 AMT 
因而 相应 的 累计 值 会 减少 。CASE 表达 式 











TRX_TYPE AMT 


PURCHASE 100 
PURCHASE 100 
PAYMENT -50 
PURCHASE 100 
PAYMENT -200 
PAYMENT -50 





依据 交易 类 型 的 评估 结果 ，AMT 值 会 被 加 入 累计 值 ， 或 者 从 累计 值 中 减 去 。 关 于 如 何 使 用 
窗口 函数 SUM OVER 或 者 标量 子 查询 进行 累计 求 和 ， 请 参考 7.6 市 。 
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本 章 介绍 简单 的 日 期 运算 技巧 ， 其 中 的 实例 涵盖 了 一 些 常 见 任务 ， 例 如 在 给 定 日 期 的 基础 
上 添加 若干 天 并 算出 新 日 期 ， 找 出 两 个 日 期 之 间 的 工作 日 个 数 ， 以 及 计算 两 个 日 期 之 间 相 
差 的 天 数 。 


熟练 运用 关系 数据 库 管理 系统 的 内 置 函 数 处 理 日 期 有 助 于 大 幅度 提高 工作 效率 。 在 本 章 
的 实例 里 ， 我 会 尽量 充分 利用 各 种 关系 数据 库 管理 系统 的 内 置 函数 。 除 此 之 外 ， 所 有 实例 
的 日 期 都 统一 使 用 “日 一 月- 年” 格式。 我 之 所 以 这 么 做 ， 是 想 为 那些 平时 工作 中 专注 于 
一 种 关系 数据 库 管理 系统 、 同 时 又 希望 了 解 其 他 关系 数据 库 管 理 系统 的 读者 提供 便利 。 统 
一 使 用 标准 格式 使 得 大 家 不 必 花 时 间 关 心 各 个 关系 数据 库 管理 系统 默认 的 日 期 格式 ， 这 样 
就 能 把 精力 放 在 不 同 的 方法 和 每 种 关系 数据 库 管 理 系统 提供 的 内 置 函 数 上 。 






































本 章 主要 介绍 基本 的 日 期 运算 。 下 一 章 的 实例 将 介绍 更 多 的 高 级 技巧 。 本 章 
r 。 的 实例 只 会 用 到 基本 的 日 期 数据 类 型 。 如 果 你 要 使 用 更 复杂 的 日 期 数据 类 
U^ 型 ， 应 在 本 章 解决 方案 的 基础 上 做 出 适当 调整 。 


8.1 年 月 日 加 减法 


1. 问题 

你 需要 在 给 定 日 期 的 基础 上 加 上 或 减 去 若干 天 、 月 或 年 。 以 员工 CLARK 的 HIREDATE 为 
例 ， 你 希望 计算 出 6 个 不 同 的 日 期 CLARK 入 职 前 后 5 天 的 日 期 ，CLARK 入 职 前 后 5 
个 月 的 日 期 ， 以 及 CLARK 入 职 前 后 5 年 的 日 期 。CLARK 的 HIREDATE 是 “09-JUN-1981” 
(1981 年 6 月 9 日 )， 你 想得到 如 下 所 示 的 结果 集 。 


HD MINUS 5D HD PLUS 5D HD MINUS 5M HD PLUS 5M HD_MINUS_5Y HD PLUS 5Y 


04-JUN-1981 14-JUN-1981 09-JAN-1981 09-NOV-1981 09-JUN-1976 09-JUN-1986 
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12-NOV-1981 22-NOV-1981 17-JUN-1981 17-APR-1982 17-NOV-1976 17-NOV-1986 
18-JAN-1982 28-JAN-1982 23-AUG-1981 23-JUN-1982 23-JAN-1977 23-JAN-1987 


2. 解决 方案 
DB2 





支持 针对 日 期 的 加 法 和 减法 运算 ， 但 不 论 加 上 一 个 数 还 是 减 去 一 个 数 ， 后 面 都 要 指定 对 应 


的 时 间 单 位 。 





1 select hiredate -5 
2 hiredate +5 
3 hiredate -5 
4 hiredate +5 
5 hiredate -5 
6 hiredate 45 
7 from emp 

8 where deptno - 10 


Oracle 


day as 
day as 
month as 
month as 
year as 
year as 











hd minus 5D, 
hd plus 5D, 
hd minus 5M, 
hd plus 5M, 
hd minus 5Y, 
hd plus 5Y 


若 要 加 上 或 减 去 若干 天 ， 使 用 加 法 或 减法 即 可 。 若 要 加 减 若 干 个 月 或 年 ， 则 需要 使 用 ADD_ 


MONTHS 国 数 。 


1 select hiredate-5 as 
2 hiredate+5 as 
3 add_months(hiredate, -5) as 
4 add_months(hiredate,5) as 
5 add_months(hiredate,-5*12) as 
6 add months(hiredate,5*12) as 
7 from emp 

8 where deptno - 10 


PostgreSQL 


hd minus 5D, 
hd plus 5D, 
hd minus, 5M, 
hd plus 5M, 
hd minus 5Y, 
hd plus 5Y 


使 用 加 减法 ， 并 使 用 INTERVAL 关键 字 指 定 要 加 上 或 者 减 去 的 时 间 单 位 。 在 指定 INTERVAL 
值 的 时 候 ， 必 须 使 用 英文 单 引 号 。 





1 select hiredate - 
2 hiredate + 
3 hiredate - 
4 hiredate + 
5 hiredate - 
6 hiredate + 
7 from emp 

8 where deptno-10 


MySQL 








interval 
interval 
interval 
interval 
interval 
interval 


'5 
5 
'5 
'5 
'5 
'5 


day' 
day' 


month ' 
month ' 


year ' 
year ' 





as hd_minus_5D, 
as hd_plus_5D, 
as hd_minus_5M, 
as hd_plus_5M, 
as hd_minus_5Y, 
as hd_plus_5Y 


使 用 加 减法 ， 并 使 用 INTERVAL 关键 字 指 定 要 加 上 或 者 减 去 的 时 间 单 位 。 不 同 于 上 述 
PostgreSQL 的 解决 方案 ， 指 定 INTERVAL 值 不 必 使 用 英文 单 引 号 。 





1 select hiredate - 
2 hiredate + 
3 hiredate - 
4 hiredate + 
5 hiredate - 
6 hiredate + 


interval 
interval 
interval 
interval 
interval 
interval 


5 
5 
5 
5 
5 
5 


day 
day 
month 
month 
year 
year 





hd_minus_5D, 
hd_plus_5D, 
hd minus, 5M, 
hd plus 5M, 
hd minus, 5Y, 
hd plus 5Y 

















7 from emp 
8 where deptno=10 


除 此 之 外 ， 还 可 以 使 用 DATE ADD 函数 ， 如 下 所 示 。 





1 select date add(hiredate,interval -5 day) as hd minus 5D, 
2 date add(hiredate,interval 5 day) as hd plus 5D, 
3 date add(hiredate,interval -5 month) as hd minus 5M, 
4 date add(hiredate,interval 5 month) as hd plus 5M, 
5 date add(hiredate,interval -5 year) as hd minus 5Y, 
6 date add(hiredate,interval 5 year) as hd plus 5DY 
7 from emp 

8 where deptno-10 


SQL Server 
使 用 DATEADD 函数 在 给 定 日 期 值 的 基础 上 加 上 或 者 减 去 若 个 时 间 单 位 。 





1 select dateadd(day,-5,hiredate) as hd_minus_5D, 
2 dateadd(day,5,hiredate) as hd plus 5D, 
3 dateadd(month,-5,hiredate) as hd minus 5M, 
4 dateadd(month,5,hiredate) as hd plus 5M, 
5 dateadd(year,-5,hiredate) as hd minus 5Y, 
6 dateadd(year,5,hiredate) as hd plus 5Y 
7 from emp 

8 where deptno - 10 


3. 讨论 

Oracle 的 解决 方案 利用 了 一 个 技巧 : 执行 日 期 运算 时 ， 整 数值 代表 天 数 。 然 而 ， 这 仅 适 用 
于 DATE 类 型 的 运算 。Oracle 9; 数据 库 引 入 了 TIMESTAMP 类 型 。 对 于 这 种 新 的 日 期 数据 类 
型 ， 需 要 使 用 PostgreSQL 解决 方案 中 的 INTERVAL。 如 果 要 把 TIMESTAMP 类 型 传递 给 诸如 
ADD MONTHS 这 样 的 旧式 日 期 函数 的 话 ， 还 有 一 件 事 要 注意 : TIMESTAMP 值 里 面 可 能 包含 了 
精确 到 秒 的 数据 ， 旧 式 的 日 期 函数 会 忽略 它们 。 
SQL 的 ISO 标准 语法 里 规定 了 INTERVAL 关键 字 以 及 紧 随 其 后 的 字符 串 常量 。 该 标准 要 求 
INTERVAL 值 必 须 位 于 英文 单 引 号 内 。PostgreSQL ( 和 Oracle 9; 数据 库 及 其 后 续 版 本 ) 遵循 
了 该 标准 。MySQL 则 不 支持 英文 单 引号 ， 略 微 偏离 了 标准 。 


8.2 ”计算 两 个 日 期 之 间 的 天 数 

1. 问题 

找 出 两 个 日 期 之 间 相 差 多 少 天 。 例 如 ， 和 希望 知道 员工 ALLEN 和 WARD 的 HIREDATE 相差 
多 少 天 。 

2. 解决 方案 

DB2 

T FE P LEE EH] WARD 和 ALLEN 的 HIREDATE。 然 后 ， 使 用 DAYS 函数 从 一 个 HIREDATE 
里 减 去 另 一 个 。 


1 select days(ward_hd) - days(aLLen_hd) 
2 from ( 
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3 select hiredate as ward_hd 
4 from emp 

5 where ename = 'WARD' 

6 ) x, 

7 ( 

8 select hiredate as allen_hd 
9 from emp 

0 where ename = 'ALLEN' 

1 ) y 


Oracle 和 PostgreSQL 
ERHALE WARD 和 ALLEN 的 HIREDATE， 然 后 相 减 。 








1 select ward hd - allen hd 
2 from ( 

3 select hiredate as ward hd 
4 from emp 

5 where ename = 'WARD' 

6 )x, 

7 ( 

8 select hiredate as allen_hd 
9 from emp 

0 where ename = 'ALLEN' 

1 ) y 


MySQL 和 SQL Server 

使 用 DATEDIFF 国 数 找 出 两 个 日 期 之 间 相 差 多 少 天 。MySQL 的 DATEDIFF 函数 只 需要 两 个 参 
数 〈 两 个 将 要 相 减 的 日 期 值 )， 并 且 相 对 较 早 的 日 期 值 应 该 作为 第 一 个 参数 以 避免 出 现 负 
数 (SQL Server 正好 相反 )。SQL Server 的 DATEDIFF 国 数 可 以 返回 指定 的 时 间 单 位 (本 例 
中 我 们 希望 以 天 为 单位 )。 下 面 给 出 了 SQL Server 的 解决 方案 。 


1 
1 









































1 select datediff(day,allen_hd,ward_hd) 
2 from ( 

3 select hiredate as ward_hd 
4 from emp 

5 where ename = 'WARD' 

6 )x, 

7 ( 

8 select hiredate as allen hd 
9 from emp 

10 where ename - 'ALLEN' 

11 ) y 


对 于 MySQL 而 言 ， 只 需 去 掉 DATEDIFF 函数 的 第 一 个 参数 ， 并 翻转 ALLEN_HD 和 WARD, HD 的 
顺序 即 可 。 


3. 讨论 
上 述 全 部 解决 方案 中 ， 内 笛 视 图 X 和 YY 被 用 于 分 别 获 取 WARD 和 ALLEN 的 HIREDATE。 例 如 : 


select ward_hd, allen_hd 





from ( 

select hiredate as ward_hd 
from emp 

where ename = 'WARD' 

















) y, 


select hiredate as allen hd 
from emp 
where ename = 'ALLEN' 


)x 


WARD, HD ALLEN, HD 


22-FEB-1981 20-FEB-1981 


因为 X 和 Y 之 间 疫 有 任何 连接 条 件 ， 这 里 会 产生 笛 卡 儿 积 。 然 后 ， 由 于 本 例 中 的 X 和 Y 都 
只 有 一 条 数据 ， 因 而 即使 没有 连接 条 件 也 不 会 有 问题 ， 结果 集 最 终 只 会 有 一 行 ( 很 明显 ， 
因为 1x 1=1)。 为 了 计算 两 个 日 期 之 间 相 差 多 少 天 ， 只 要 使 用 适当 的 方法 用 一 个 日 期 减 去 
另 一 个 日 期 即 可 。 


8.3 计算 两 个 日 期 之 间 的 工作 日 天 数 


1. 问题 
给 定 两 个 日 期 ， 你 想 知 道 两 者 之 间 有 多 少 个 工作 日 ， 并 且 两 个 日 期 自身 也 要 计算 进去 。 例 
如 ， 如 果 工 月 10 日 是 星期 一 ，1 月 11 日 是 星期 二 ， 则 两 者 之 间 的 工作 日 个 数 是 2， 这 是 
因为 两 个 日 期 都 是 工作 日 。 对 于 本 实例 而 言 ,“ 工 作 日 ”定义 为 除了 星期 六 和 星期 日 以 外 
的 日 子 。 


2. 解决 方案 

下 面 的 解决 方案 以 找 出 BLAKE 和 JONES 的 HIREDATE 之 间 有 多 少 个 工作 日 为 例 。 为 了 计 
算 两 个 日 期 之 间 的 工作 日 天 数 ， 我 们 可 以 使 用 数据 透视 表 ， 把 两 个 日 期 之 间 的 每 一 天 ( 包 
括 开始 和 结束 日 期 ) 都 作为 单独 的 一 行 返 回 。 这 样 的 话 ， 统 计 工 作 日 天 数 就 变 成 了 计算 有 
多 少 个 既 不 是 星期 六 又 不 是 星期 日 的 日 期 。 
































oa 
` 





如 果 想 要 把 假日 也 排除 在 外 ， 就 需要 创建 一 个 HOLIDAYS 表 。 然 后 在 本 解决 方 
。 案 基础 上 ， 使 用 NOT IN 排除 掉 HOLIDAYS 表 里 列 出 的 日 期 。 


` 
A, 





























DB2 
使 用 数据 透视 表 T500 生成 所 需要 的 行 数 (两 个 日 期 之 间 的 天 数 ) 的 结果 集 。 然 后 统计 非 周 
末日 期 的 个 数 。 使 用 DAYNAME 函数 能 够 知道 一 个 日 期 是 星期 儿 。 例如 | 


1 select sum(case when dayname(jones_hd+t500.id day -1 day) 
2 in ( 'Saturday','Sunday' ) 

3 then 0 else 1 

4 end) as days 

5 from ( 

6 select max(case when ename = 'BLAKE' 
7 then hiredate 

8 end) as blake_hd, 

9 max(case when ename = 'JONES' 
0 


1 then hiredate 





11 end) as jones_hd 

12 from emp 

13 where ename in ( 'BLAKE','JONES' ) 
14 )x, 

15 t500 

16 where t500.id <= blake hd-jones hd«1 


MySQL 




















使 用 数据 透视 表 T5060 生成 所 需要 的 行 数 (SB BJ Z BJ0J 3) 的 结果 集 ， 然 后 统计 非 周 
末日 期 的 个 数 。 使 用 DATE ADD 函数 为 每 一 个 日 期 加 上 若干 天 。 使 用 DATE. FORMAT 函数 能 够 


知道 一 个 日 期 是 星期 几 。 





select sum(case when date format( 
date add(jones hd, 


L 

2 

3 

4 in ( 'Sat','Sun' ) 
5 then 0 else 1 

6 end) as days 

7 

8 

9 


from ( 
select max(case when ename = 'BLAKE' 
then hiredate 
10 end) as blake_hd, 
11 max(case when ename = 'JONES' 
12 then hiredate 
13 end) as jones hd 


14 from emp 

15 where ename in ( 'BLAKE','JONES' ) 

16 )x, 

17 t500 

18 where t500.id <= datediff(blake hd,jones hd)41 


Oracle 





interval t500.id-1 DAY),'Xa') 

















使 用 数据 透视 表 T500 生成 所 需要 的 行 数 (两 个 日 期 之 间 的 天 数 ) 的 结果 集 ， 然 后 统计 非 周 


末日 期 的 个 数 。 使 用 TO_CHAR 函数 能 够 知道 一 个 日 期 是 星期 儿 。 


select sum(case when to_char(jones_hd+t500.id-1,'DY') 
in ( 'SAT','SUN' ) 
then 0 else 1 
end) as days 


select max(case when ename = 'BLAKE' 
then hiredate 


1 
2 
3 
4 
5 from ( 
6 
7 
8 end) as blake_hd, 


9 max(case when ename = 'JONES' 
10 then hiredate 
11 end) as jones_hd 


12 from emp 

13 where ename in ( 'BLAKE','JONES' ) 
14 )x, 

15 t500 

16 where t500.id <= blake_hd-jones_hd+1 


PostgreSQL 

















使 用 数据 透视 表 T500 生成 所 需要 的 行 数 (两 个 日 期 之 间 的 天 数 ) 的 结果 集 ， 然 后 统计 非 周 

















末日 期 的 个 数 。 使 用 TO_CHAR 函数 能 够 知道 一 个 日 期 是 星期 儿 。 


select sum(case when trim(to_char(jones_hd+t500.id-1,'DAY')) 
in ( 'SATURDAY','SUNDAY' ) 
then 0 else 1 
end) as days 


select max(case when ename = 'BLAKE' 
then hiredate 


1 
2 
3 
4 
5 from ( 
6 
7 
8 end) as blake_hd, 


9 max(case when ename = 'JONES' 
10 then hiredate 
11 end) as jones_hd 


12 from emp 

13 where ename in ( 'BLAKE','JONES' ) 
14 ) x, 

15 t500 

16 where t500.id <= blake_hd-jones_hd+1 


SQL Server 
使 用 数据 透视 表 T500 生成 所 需要 的 行 数 (两 个 日 期 之 间 的 天 数 ) 的 结果 集 ， 然 后 统计 非 周 
末日 期 的 个 数 。 使 用 DATENAME 函数 能 够 知道 一 个 日 期 是 星期 几 。 





1 select sum(case when datename(dw,jones_hd+t500.id-1) 
2 in ( 'SATURDAY','SUNDAY' ) 

3 then 0 else 1 

4 end) as days 

5 from ( 

6 select max(case when ename = 'BLAKE' 
7 then hiredate 

8 end) as blake_hd, 

9 max(case when ename = 'JONES' 
10 then hiredate 

11 end) as jones_hd 

12 from emp 

13 where ename in ( 'BLAKE','JONES' ) 


14 )x, 

15 t500 

16 where t500.id <= datediff(day,jones hd-blake hd)41 
3. 讨论 


尽管 不 同 数据 库 要 调用 不 同 的 内 置 函 数 来 确认 一 个 日 期 是 星期 几 ， 但 上 述 解决 方案 的 思路 
都 是 相同 的 。 具 体 做 法 分 为 两 步 : 

(D) 计算 出 开始 日 期 和 结束 日 期 之 间 相隔 多 少 天 (包含 开始 日 期 和 结束 日 期 ) ; 

(2) 排除 掉 周 末 ， 统 计 有 多 少 个 工作 日 (实际 是 在 计算 有 多 少 条 记录 )。 

ARME X 负责 完成 第 一 步 工作 。 仔 细 查 看 内 和 藤 视图 x 的 话 ， 我 们 会 注意 到 它 使 用 了 聚合 
国 数 MAX， 其 目的 在 于 排除 掉 NtL。 如 果 不 了 解 MAX 的 用 处 ， 下 面 的 查询 结果 输出 能 帮 有 我 
们 加 深 理 解 。 下 面 的 输出 内 容 展示 了 没有 MAX 函数 的 内 舱 视 图 X 的 查询 结果 。 


select case when ename = 'BLAKE' 
then hiredate 


























> 



































I 














end as blake_hd, 
case when ename = 'JONES' 
then hiredate 
end as jones hd 
from emp 
where ename in ( 'BLAKE','JONES' ) 


BLAKE HD JONES HD 
02-APR-1981 
01-MAY-1981 


如 果 不 调用 MAX 函数 ， 会 有 两 行 查询 结果 。 有 了 MAX 函数 ， 查 询 结果 就 是 一 行 ，Null 会 被 
过 着 掉 。 


select max(case when ename = 'BLAKE' 
then hiredate 
end) as blake hd, 
max(case when ename - 'JONES' 
then hiredate 
end) as jones hd 
from emp 
where ename in ( 'BLAKE','JONES' ) 
































BLAKE HD JONES HD 


01-MAY-1981 02-APR-1981 


两 个 日 期 之 间 相 差 30 天 (包含 开始 日 期 和 结束 日 期 )。 现 在 ， 我 们 在 同一 行 中 得 到 了 两 个 
日 期 ， 下 一 步 就 是 为 这 30 天 里 的 每 一 天 单独 生成 一 行 记录 。 为 了 得 到 30 天 (4T) 的 记 
录 ， 这 里 用 到 了 T500 36, T500 表 的 ID 列 每 一 个 值 都 等 于 前 面 一 行 的 值 加 上 1， 在 两 个 日 
期 中 较 早 的 那个 (JONES_HD) 的 基础 上 依次 加 上 T5069 表 对 应 的 值 ， 这 样 就 生成 了 JONES. 
HD 和 BLAKE_HD 之 间 的 连续 日 期 序列 。 结 果 如 下 所 示 (使 用 Oracle 语法 )。 


select x.*, t500.*, jones_hd+t500.id-1 
from ( 
select max(case when ename = 'BLAKE' 
then hiredate 
end) as blake hd, 
max(case when ename = 'JONES' 
then hiredate 
end) as jones hd 
from emp 
where ename in ( 'BLAKE','JONES' ) 
) x, 
t500 
where t500.id <= blake_hd-jones_hd+1 


















































BLAKE_HD JONES_HD ID JONES_HD+T5 
01-MAY-1981 02-APR-1981 1 02-APR-1981 
01-MAY-1981 02-APR-1981 2 03-APR-1981 
01-MAY-1981 02-APR-1981 3 04-APR-1981 
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01-MAY-1981 02-APR-1981 05-APR-1981 


4 
01-MAY-1981 02-APR-1981 5 06-APR-1981 
01-MAY-1981 02-APR-1981 6 07-APR-1981 
01-MAY-1981 02-APR-1981 7 08-APR-1981 
01-MAY-1981 02-APR-1981 8 09-APR-1981 
01-MAY-1981 02-APR-1981 9 10-APR-1981 
01-MAY-1981 02-APR-1981 10 11-APR-1981 
01-MAY-1981 02-APR-1981 11 12-APR-1981 
01-MAY-1981 02-APR-1981 12 13-APR-1981 
01-MAY-1981 02-APR-1981 13 14-APR-1981 
01-MAY-1981 02-APR-1981 14 15-APR-1981 
01-MAY-1981 02-APR-1981 15 16-APR-1981 
01-MAY-1981 02-APR-1981 16 17-APR-1981 
01-MAY-1981 02-APR-1981 17 18-APR-1981 
01-MAY-1981 02-APR-1981 18 19-APR-1981 
01-MAY-1981 02-APR-1981 19 20-APR-1981 
01-MAY-1981 02-APR-1981 20 21-APR-1981 
01-MAY-1981 02-APR-1981 21 22-APR-1981 
01-MAY-1981 02-APR-1981 22 23-APR-1981 
01-MAY-1981 02-APR-1981 23 24-APR-1981 
01-MAY-1981 02-APR-1981 24 25-APR-1981 
01-MAY-1981 02-APR-1981 25 26-APR-1981 
01-MAY-1981 02-APR-1981 26 27-APR-1981 
01-MAY-1981 02-APR-1981 27 28-APR-1981 
01-MAY-1981 02-APR-1981 28 29-APR-1981 
01-MAY-1981 02-APR-1981 29 30-APR-1981 
01-MAY-1981 02-APR-1981 30 01-MAY-1981 


如 果 仔 细 查 看 WHERE 子 句 的 话 ， 我 们 会 注意 到 BLAKE. HD 和 JONES HD 相 减 后 又 加 上 了 1, 3X 
是 为 了 生成 所 需 的 30 行 记录 (否则 就 是 29 行 )。 我 们 也 要 注意 到 外 层 查 询 的 SELECT 列表 
里 T500.ID RAT 1， 这 是 因为 ID 列 的 起 始 值 是 1， 如 果 在 JONES_HD 基础 上 加 上 1 就 等 同 
于 从 最 终结 果 里 排除 掉 了 JONES HD, 


一 旦 生成 了 所 需 数目 的 行 记录 ， 接 着 使 用 CASE 表达 式 来 标记 每 一 个 日 期 是 工作 日 或 者 周末 
(若是 工作 日 返回 1， 周 末 则 返回 0)。 最 后 使 用 聚合 函数 SUM 来 合计 1 的 个 数 ， 并 得 到 最 
终 答案 。 


8.4 计算 两 个 日 期 之 间 相 差 的 月 份 和 年 份 


1. 问题 
找 出 两 个 日 期 之 间 相差 多 少 个 月 或 者 多 少年 。 例 如 ， 和 希望 知道 第 一 个 和 最 后 一 个 员工 的 入 
职 开 始 日 期 之 间 相 差 多 少 个 月 ， 同 时 也 希望 把 这 个 差 值 换算 成 年 。 


2. 解决 方案 

一 年 有 12 个 月 ， 我 们 可 以 算出 两 个 日 期 之 间 相 差 几 个 月 ， 然 后 除 以 12 得 到 相应 的 年 份 。 
在 上 述 做 法 的 基础 上 ， 可 能 有 必要 对 年 份 的 计算 结果 做 向 上 或 者 向 下 的 舍 人 。 例 如 ，ENMP 
表 里 最 早 的 HIREDATE 是 17-DEC-1980， 最 新 的 则 是 12-JAN-1983。 如 果 纯 粹 做 数学 运算 ， 二 
者 相差 三 年 (1983 减 去 1980)， 然 而 它们 的 实际 差 值 只 有 大 约 25 个 月 (2 年 多 一 点 )。 我 
们 应 该 根据 需要 调整 做 法 ， 本 市 的 解决 方案 给 出 的 答案 将 会 是 25 个 月 和 大 约 2 年 。 
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DB2 和 MySQL 
使 用 函数 YEAR 和 MONTH 计算 出 给 定 日 期 的 含有 4 位 数字 的 年 份 和 含有 2 位 数字 的 月 份 。 


1 select mnth，mnth/12 

2 from ( 

3 select (year(max_hd) - year(min_hd))*12 + 

4 (month(max_hd) - month(min_hd)) as mnth 

5 from ( 

6 select min(hiredate) as min hd, max(hiredate) as max hd 
7 from emp 

8 )x 

9 ) y 


Oracle 


使 用 MONTHS_BETWEEN 函数 找 出 两 个 日 期 之 间 相 差 多 少 个 月 〈 再 除 以 12 就 可 以 得 到 相差 多 少年 )。 


1 select months_between(max_hd,min_hd), 

2 months between(max hd,min hd)/12 

3 from ( 

4 select min(hiredate) min hd, max(hiredate) max hd 
5 from emp 

6 


) x 


PostgreSQL 
使 用 EXTRACT 函数 计算 出 给 定 日 期 的 含有 4 位 数字 的 年 份 和 含有 2 位 数字 的 月 份 。 


select mnth, mnth/12 

from ( 
select ( extract(year from max_hd) - 
extract(year from min hd) ) * 12 


1 

2 

3 

4 

5 + 
6 ( extract(month from max_hd) - 

7 extract(month from min_hd) ) as mnth 

8 from ( 

9 select min(hiredate) as min hd, max(hiredate) as max hd 
10 from emp 

11 )x 


12 )y 


SQL Server 
使 用 DATEDIFF 函数 找 出 两 个 日 期 之 间 相 差 多 少 个 月 (再 除 以 12 就 可 以 得 到 相差 多 少年 )。 
1 select datediff(month,min hd,max hd), 
2 datediff(month,min hd,max hd)/12 
3 from ( 
4 select min(hiredate) min hd, max(hiredate) max hd 
5 from emp 
6 


)x 
3. 讨论 
DB2, MySQL 和 PostgreSQL 
一 旦 提取 出 MIN HD 和 MAX, HD 的 年 份 和 月 份 ， 计 算 MIN, HD 和 MAX. HD 之 间 相 差 的 月 份 和 年 份 
的 方法 对 于 所 有 数据 库 都 将 是 相同 的 。 接 下 来 的 讨论 将 涵盖 这 3 种 数据 库 。 内 艇 视图 X 将 























找 出 EMP 表 里 最 早 的 和 最 新 的 HIREDATE， 如 下 所 示 。 


select min(hiredate) as min hd, 
max(hiredate) as max hd 
from emp 


MIN HD MAX. HD 


17-DEC-1980 12-JAN-1983 


29 TREH MAX HD 和 MIN HD 之 间 相 差 的 月 份 ， 先 用 它们 相差 的 年 份 乘 以 12， 然 后 再 加 上 月 
份 的 差 值 。 如 果 你 还 是 不 太 理 解 这 样 做 的 原因 ， 不 妨 分 别 打 印 出 每 个 日 期 的 年 和 月 两 个 部 
分 。 下 面 显示 了 它们 的 值 。 


select year(max_hd) as max_yr, year(min_hd) as min_yr, 
month(max_hd) as max_mon, month(min_hd) as min_mon 
from ( 
select min(hiredate) as min_hd, max(hiredate) as max_hd 
from emp 


)x 























MAX_YR MIN YR MAX MON — MIN MON 


根据 上 述 结 果 ，MAX_HD 和 MIN HD 之 间 相 差 的 月 份 就 是 (1983-1980) x 12 + (1-12). 79 f dX 
出 两 个 日 期 之 间 相 差 的 年 份 ， 就 把 前 面 计 算出 来 的 月 份 差 值 除 以 12。 再 次 强调 ， 我 们 可 能 
需要 根据 实际 状况 对 年 份 的 计算 结果 做 出 适当 地 舍 入 处 理 。 
Oracle 和 SQL Server 
ARLE X 检索 EMP 表 里 最 早 的 和 最 新 的 HIREDATE， 如 下 所 示 。 


select min(hiredate) as min_hd, max(hiredate) as max_hd 
from emp 












































MIN_HD MAX_HD 


17-DEC-1980 12-JAN-1983 

















Oracle 和 SQL Server 提供 了 函数 (分别 是 MONTHS, BETWEEN 和 DATEDIFF) 用 于 计算 两 个 给 
定 日 期 之 间 相 差 的 月 份 。 为 了 计算 相差 的 年 份 ， 把 月 份 差 值 除 以 12 即 可 。 


8.5 计算 两 个 日 期 之 间 相 差 的 秒 数 、 分 钟 数 和 
小 时 数 














1. 问题 
算出 两 个 日 期 之 间 相 差 多 少 秒 。 例 如 ， 和 希望 知道 ALLEN 和 WARD 的 HIREDATE 之 间 相 差 
多 少 秒 、 多 少 分 钟 以 及 多 少 小 时 。 





2. 解决 方案 

如 果 我 们 能 算出 来 两 个 日 期 之 间 相 差 多 少 天 ， 那 么 也 就 能 知道 它们 相差 多 少 秒 、 多 少 分 钟 
和 多 少 小 时 ， 只 需 对 不 同 的 时 间 单 位 做 出 相应 的 换算 即 可 。 

DB2 

使 用 DAYS 函数 计算 ALLEN 和 WARD 的 HIREDATE 之 间 相差 多 少 天 ， 然 后 进行 时 间 单 位 
换算 。 








1 select dy*24 hr, dy*24*60 min, dy*24*60*60 sec 
2 from ( 

3 select ( days(max(case when ename = 'WARD' 

4 then hiredate 

5 end)) - 

6 days(max(case when ename = 'ALLEN' 

7 then hiredate 
8 end)) 
9 ) as dy 

0 from emp 

1 


) x 


MySQL 和 SQL Server 
使 用 DATEDIFF 函数 计算 ALLEN fH WARD 的 HIREDATE 之 间 相 差 多 少 天 ， 然 后 进行 时 间 自 
位 换算 。 


[z^ 





1 select datediff(day,allen hd,ward hd)*24 hr, 

2 datediff(day,allen hd,ward hd)*24*60 min, 

3 datediff(day,allen hd,ward hd)*24*60*60 sec 
4 from ( 

5 select max(case when ename - 'WARD' 
6 then hiredate 
7 end) as ward hd, 

8 


max(case when ename - 'ALLEN' 
9 then hiredate 
10 end) as allen hd 
11 from emp 
12 )x 
Oracle 和 PostgreSQL 


使 用 减法 计算 ALLEN 和 WARD 的 HIREDATE 之 间 相差 多 少 天 ， 然 后 进行 时 间 单 位 换算 。 


1 select dy*24 as hr, dy*24*60 as min, dy*24*60*60 as sec 
2 from ( 

3 select (max(case when ename = 'WARD' 

4 then hiredate 

5 end) - 

6 max(case when ename - 'ALLEN' 

7 then hiredate 

8 end)) as dy 

9 from emp 

10 )x 


3. 讨论 
fE EXSBUHRUARARJ; EF, WEAN 











WR] 


X 都 被 用 来 获取 WARD 和 ALLEN 的 HIREDATE， 如 下 所 示 。 


























select max(case when ename = 'WARD' 
then hiredate 
end) as ward hd, 
max(case when ename - 'ALLEN' 
then hiredate 
end) as allen hd 
from emp 


WARD, HD ALLEN, HD 


22-FEB-1981 20-FEB-1981 


WARD. HD 和 ALLEN. HD 之 间 相 差 的 天 数 分 别 乘 以 24. (一 天 的 小 时 数 ) 1440 (一 天 的 分 钟 数 ) 
和 86400 (一 天 的 秒 数 ) ， 就 得 到 最 终结 果 了 。 


8.6 统计 一 年 中 有 多 少 个 星期 一 





1. 问题 

你 想 知道 一 年 中 有 多 少 个 星期 一 、 星 期 二 、 星 期 三 等 。 
2. 解决 方案 

为 了 统计 出 一 年 里 每 个 “星期 x” 出 现 的 次 数 ， 我 们 必须 : 








(1) 生成 一 年 里 所 有 可 能 的 日 期 值 ， 

(2) 格 式 化 上 述 日 期 值 ， 并 找 出 它们 分 别 是 星期 几 ， 

(3) 统计 每 个 “星期 x” 出 现 的 次 数 。 

DB2 

使 用 WITH 递归 查 询 ， 这 样 就 不 需要 对 一 个 至 少 含 有 366 行 记 录 的 表 做 SELECT 查询 了 。 使 
用 DAYNAME 函数 获知 每 一 个 日 期 是 星期 几 ， 然 后 统计 每 个 “星期 x” 出 现 的 次 数 。 

















1 with x (start_date,end_date) 

2 as( 

3 select start date, 

4 start date + 1 year end date 
5 from ( 

6 select (current date - 

7 dayofyear(current date) day) 
8 *1 day as start date 

9 from t1 

10 )tmp 


11 union all 
12 select start date + 1 day, end date 


13 from x 
14 where start date + 1 day < end date 
15 ) 


16 select dayname(start date),count(*) 
17 from x 
18 group by dayname(start date) 
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MySQL 





针对 T500 表 做 SELECT 查询 以 产生 出 足够 行 数 的 结果 集 ， 每 一 行 记录 代表 一 年 中 的 一 个 
日 期 。 使 用 DATE FORMAT 函数 获知 每 一 个 日 期 是 星期 几 ， 然 后 统计 每 个 “星期 x” 出 现 的 


次 数 o 
1 select date format( 
2 date add( 
3 cast( 
4 concat(year(current date),'-01-01') 
5 as date), 
6 interval t500.id-1 day), 
7 'XW') day, 
8 count(*) 
9 from t500 
10 where t500.id «- datediff( 
11 cast( 
12 concat(year(current date)41,'-01-01') 
13 as date), 
14 cast( 
15 concat(year(current date),'-01-01') 
16 as date)) 
17 group by date format( 
18 date add( 
19 cast( 
20 concat(year(current date),'-01-01') 
21 as date), 
22 interval t500.id-1 day), 
23 '%W') 
Oracle 
对 于 Oracle 9; 及 其 后 续 版 本 ， 可 以 使 用 CONNECT BY 递归 查询 返回 一 年 中 的 每 一 天 。 如 果 是 








Oracle 8; 或 更 早 版 本 ， 则 需要 针对 T500 表 做 SELECT 查询 以 产生 出 足够 行 数 的 结果 集 ， 每 
一 行 记录 代表 一 年 中 的 一 个 日 期 。 不 论 哪 种 方法 ， 都 需要 使 用 TO_CHAR 函数 以 获知 每 一 个 


日 期 是 星期 几 ， 然 后 统计 每 个 “星期 x” 出 现 的 次 数 。 
首先 来 看 一 下 CONNECT BY 解决 方案 。 


with x as ( 
select level lvl 
from dual 
connect by level <= ( 





) 
) 


from x 


@ XO OO —I O n + Ü) N P 


Y 


其 次 是 针对 Oracle 早期 版 本 的 解决 方案 。 


1 select to char(trunc(sysdate, 'y' )«rownum-1, 'DAY 
2 count(*) 
3 from t500 


add months(trunc(sysdate,'y'),12)-trunc(sysdate, 'y') 


group by to char(trunc(sysdate, 'y')4lvl-1,'DAY') 


'), 


select to_char(trunc(sysdate,'y')+lvl-1,'DAY'), count(*) 
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4 where rownum <= (add_months(trunc(sysdate,'y'),12) 


5 


- trunc(sysdate,'y')) 


6 group by to_char(trunc(sysdate,'y')+rownum-1,'DAY') 


PostgreSQL 
使 用 内 置 函数 





GENERATE SERIES 为 一 年 中 的 每 一 天 生成 一 行 记录 。 然 后 使 用 TO. CHAR 函数 


获知 每 一 个 日 期 是 星期 几 。 最 后 ， 统 计 每 个 “星期 x” 出 现 的 次 数 。 例 如 : 


1 
2 
3 
4 
5 
6 
7 
8 


select to_char( 


cast( 


date_trunc('year',current_date) 


as date) + gs.id-1,'DAY'), 
count(*) 


from generate series(1,366) gs(id) 
where gs.id «- (cast 


( date trunc('year',current date) + 
interval '12 month' as date) - 


10 cast(date trunc('year',current date) 


as date)) 


12 group by to char( 


SQL Server 
使 用 WITH 递归 








Cast( 
date_trunc('year',current_date) 
as date) + gs.id-1,'DAY') 


查询 ， 这 样 就 不 需要 对 一 个 至 少 含有 366 行 记录 的 表 做 SELECT 查询 了 。 如 





果 是 早期 不 支持 WITH 子 句 的 SQL Server 版 本 ， 参 考 Oracle 解决 方案 里 使 用 数据 透视 表 的 
做 法 。 使 用 DATENAME 函数 获知 一 个 日 期 是 星期 几 ， 然 后 统计 每 个 “星期 x+” 出 现 的 次 数 。 





例如 : 


as ( 


= > 
PB @ X O +I wm 和 上 wm 


union 


= 
N 


) 


H o A x. 
O 上 WwW 


with x (start date,end date) 


select start date, 


dateadd(year,1,start date) end date 


from ( 
select cast( 


cast(year(getdate()) as varchar) + '-01-01' 
as datetime) start date 


from t1 


) tmp 
all 


select dateadd(day,1,start date), end date 
from x 
where dateadd(day,1,start date) < end date 


select datename(dw,start date),count(*) 


17 from x 
18 group by datename(dw,start date) 


19 OPTION 


3. 讨论 
DB2 


(MAXRECURSION 366) 


WITH 递归 查询 视图 Xx BARILE TMP 返回 当前 年 份 第 一 天 的 日 期 ， 如 下 所 示 。 
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select (current_date - 
dayofyear(current_date) day) 
+1 day as start_date 
from t1 


START_DATE 


01-JAN-2005 


然后 在 START_DATE 基础 上 加 上 一 年 ， 这 样 我 们 就 知道 了 这 一 年 的 第 一 天 和 最 后 一 天 的 日 
期 。 我 们 需要 知道 这 两 个 日 期 ， 因 为 要 生成 这 一 年 的 所 有 日 期 。START_DATE 和 END. DATE 如 
下 所 示 。 


select start date, 
start date + 1 year end date 
from ( 
select (current date - 
dayofyear(current date) day) 
*1 day as start date 
from t1 


) tmp 

















START DATE END DATE 


01-JAN-2005 01-JAN-2006 


下 一 步 是 为 START_DATE 加 上 一 天 ， 如 此 循环 往复 ， 直 到 它 等 于 END_DATE。 下 面 展示 了 WITH 
递归 查询 视图 X 返 回 的 结果 集 的 一 部 分 。 


with x (start_date,end_date) 
as ( 
select start date, 
start date + 1 year end date 
from ( 
select (current date - 
dayofyear(current date) day) 
*1 day as start date 
from t1 
) tmp 
union all 
select start date + 1 day, end date 
from x 
where start date + 1 day < end date 


) 


select * from x 








START DATE END DATE 

01-JAN-2005 01-JAN-2006 
02-JAN-2005 01-JAN-2006 
03-JAN-2005 01-JAN-2006 


29-JAN-2005 01-JAN-2006 
30-JAN-2005 01-JAN-2006 











期 运算 | 183 











31-JAN-2005 01-JAN-2006 


01-DEC-2005 01-JAN-2006 
02-DEC-2005 01-JAN-2006 
03-DEC-2005 01-JAN-2006 


29-DEC-2005 01-JAN-2006 
30-DEC-2005 01-JAN-2006 
31-DEC-2005 01-JAN-2006 


最 后 ， 针 对 WITH 递归 查询 视图 X 的 返回 结果 调用 DAYNAME 函数 ， 并 统计 每 个 “星期 x” 出 
现 的 次 数 。 最 终结 果 如 下 所 示 。 


with x (start date,end date) 
as ( 
select start date, 
start date + 1 year end date 
from ( 
select (current date - 
dayofyear(current date) day) 
*1 day as start date 
from t1 
) tmp 
union all 
select start date + 1 day, end date 
from x 
where start date + 1 day < end date 
) 
select dayname(start date),count(*) 
from x 
group by dayname(start date) 























START DATE — COUNT(*) 


FRIDAY 52 
MONDAY 52 
SATURDAY 53 
SUNDAY 52 
THURSDAY 52 
TUESDAY 52 
WEDNESDAY 52 
MySQL 


本 解决 方案 结合 T500 表 执 行 SELECT 查询 ， 为 一 年 中 的 每 一 个 日 期 生成 单独 的 一 行 数 据 。 
第 4 行 的 命令 用 于 生成 当前 年 份 的 第 一 天 。 它 的 做 法 是 调用 CURRENT. DATE 函数 得 到 年 份 ， 
然后 在 后 面 附加 上 月 份 和 天 (遵守 MySQL 默认 的 日 期 格式 )。 结 果 如 下 所 示 。 


select concat(year(current_date),'-01-01') 
from t1 


























START_DATE 








现在 有 了 当前 年 份 第 一 天 的 日 期 ， 调 用 DATEADD 国 数 将 其 与 T500.ID 逐一 相 加 以 生成 一 年 
里 的 每 一 天 。 调 用 DATE_FORMAT 函数 能 够 返回 每 一 个 日 期 是 星期 儿 。 为 了 以 T560 表 为 基础 
生成 足够 多 的 行 ， 要 先 找 出 当前 年 份 第 一 天 和 下 一 年 度 第 一 天 之 间 的 差 值 ， 并 生成 与 之 相 
等 数目 的 行 (应 该 是 365 行 或 者 366 行 )。 部 分 查询 结果 如 下 所 示 。 


select date_format( 
































date_add( 
cast( 
concat(year(current_date),'-01-01') 
as date), 
interval t500.id-1 day), 
'%W') day 
from t500 
where t500.id «- datediff( 
cast( 
concat(year(current date)-1,'-01-01') 
as date), 
cast( 
concat(year(current date), '-01-01') 
as date)) 
DAY 
01-JAN-2005 
02- JAN-2005 
03- JAN-2005 
29-JAN-2005 
30-JAN-2005 
31-JAN-2005 
01-DEC-2005 
02-DEC-2005 
03-DEC-2005 
29-DEC-2005 
30-DEC-2005 
31-DEC-2005 





现在 有 了 当前 年 份 每 一 天 的 日 期 了 ， 接 下 来 要 调用 DAYNAME 函数 得 到 每 一 个 日 期 是 星期 几 ， 
并 统计 每 个 “星期 zx” 出 现 的 次 数 。 最 终结 果 如 下 所 示 。 


select date_format( 








date_add( 
cast( 
concat(year(current_date),'-01-01') 
as date), 
interval t500.id-1 day), 
'%W') day, 
count(*) 
from t500 
where t500.id «- datediff( 


cast( 
concat(year(current date)-1,'-01-01') 
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as date), 


cast( 
concat(year(current_date),'-01-01') 
as date)) 
group by date_format( 
date_add( 
cast( 
concat(year(current date),'-01-01') 
as date), 
interval t500.id-1 day), 
'%W') 
DAY COUNT(*) 
FRIDAY 52 
MONDAY 52 
SATURDAY 53 
SUNDAY 52 
THURSDAY 52 
TUESDAY 52 
WEDNESDAY 52 


Oracle 

有 两 种 解决 方案 : 结合 T500 表 (数据 透视 表 ) 执行 SELECT 查询 ， 或 者 使 用 CONNECT BY 和 
WITH 递归 查询 ， 都 能 为 当前 年 份 的 每 一 个 日 期 生成 单独 的 一 行 数 据 。 使 用 TRUNC 函数 把 当 
前 的 系统 日 期 转换 为 当前 年 份 的 第 一 天 。 


对 于 CONNECT BY 和 WITH 解决 方案 ， 我 们 利用 临时 的 LEVEL. 列 生成 从 1 开始 的 数字 序列 。 为 
了 生成 足够 多 行 的 数据 ， 根 据 当前 年 份 第 一 天 和 下 一 年 度 第 一 天 之 间 的 差 值 (应 该 是 365 
天 或 者 366 K) (xt ROWNUM 或 者 LEVEL。 下 一 步 就 是 在 当前 年 份 第 一 天 的 基础 上 依次 加 上 
ROWNUM 或 者 LEVEL。 部 分 查询 结果 如 下 所 示 。 


/* Oracle 9i 及 后 续 版 本 */ 
with x as ( 
select level lvl 
from dual 
connect by level <= ( 
add months(trunc(sysdate, ' y '),12) -trunc(sysdate, ' y') 
) 
) 
select trunc(sysdate, ' y ')«lvl-1 
from x 


对 于 使 用 数据 透视 表 的 解决 方案 ， 我 们 可 以 使 用 任何 行 数 超过 366 行 的 表 或 者 视图 。 由 于 
Oracle 支持 ROWNUM， 我 们 并 不 需要 一 个 从 1 开始 递增 的 表 。 在 下 面 的 例子 中 ， 我 们 利用 数 
据 透视 表 T500 来 返回 当前 年 份 的 每 一 天 。 
/* Oracle 8i 及 更 早 版 本 */ 
select trunc(sysdate,'y')+rownum-1 start date 
from t500 


where rownum <= (add_months(trunc(sysdate,'y'),12) 
- trunc(sysdate,'y')) 






























































START_DATE 

01-JAN-2005 
02-JAN-2005 
03-JAN-2005 


29-JAN-2005 
30-JAN-2005 
31-JAN-2005 


01-DEC-2005 
02-DEC-2005 
03-DEC-2005 


29-DEC-2005 
30-DEC-2005 
31-DEC-2005 


不 论 是 哪 种 解决 方案 ， 最 终 我 们 必须 调用 TO. CHAR 函数 获取 每 一 个 日 期 分 别 是 星期 几 ， 然 
后 统计 每 个 “星期 * ”出现 的 次 数 。 最 终结 果 如 下 所 示 。 


/* Oracle 9i 及 后 续 版 本 */ 

with x as ( 

select level lvl 
from dual 

connect by level <= ( 

add_months(trunc(sysdate,'y'),12)-trunc(sysdate,'y') 

) 

) 

select to_char(trunc(sysdate,'y')+lvl-1,'DAY'), count(*) 
from x 

group by to char(trunc(sysdate, 'y')4lvl-1,'DAY') 


/* Oracle 8i 及 更 早 版 本 */ 
select to_char(trunc(sysdate,'y')+rownum-1,'DAY') start date, 
count(*) 
from t500 
where rownum <= (add, months(trunc(sysdate, 'y'),12) 
- trunc(sysdate, 'y')) 
group by to char(trunc(sysdate, 'y')«rownum-1, 'DAY') 


START DATE — COUNT(*) 


FRIDAY 52 
MONDAY 52 
SATURDAY 53 
SUNDAY 52 
THURSDAY 52 
TUESDAY 52 
WEDNESDAY 52 
PostgreSQL 





首先 调用 DATE TRUNC 函数 获取 当前 的 年 份 (如 下 所 示 ， 由 于 针对 T1 做 查询 ， 因 而 只 返回 
一 行 结果 )。 





LI 























select cast( 
date_trunc('year',current_date) 
as date) as start_date 
from t1 


START_DATE 


01-JAN-2005 





然后 ， 针 对 一 个 至 少 有 366 行 的 数据 源 〈 任 何 表 达 式 均 可 ) 执行 SELECT 查询 。 本 解决 方 








案 采 用 了 GENERATE SERIES 函数 作为 数据 源 。 当 然 ， 这 里 也 可 以 月 
前 年 份 第 一 天 的 基础 上 逐次 加 上 1， 直 到 把 一 年 中 的 每 一 天 都 作为 单独 的 一 行 返回 


下 所 示 )。 


select cast( date_trunc('year' ,current_date) 
as date) + gs.id-1 as start_date 
from generate_series (1,366) gs(id) 
where gs.id <= (cast 
( date_trunc('year',current_date) + 
interval '12 month' as date) - 
cast(date_trunc('year',current_date) 
as date)) 


START_DATE 

01-JAN-2005 
02-JAN-2005 
03-JAN-2005 


29-JAN-2005 
30-JAN-2005 
31-JAN-2005 


01-DEC-2005 
02-DEC-2005 
03-DEC-2005 


29-DEC-2005 
30-DEC-2005 
31-DEC-2005 











H T500 表 。 然 后 ， 在 当 











(如 


最 后 ， 调 用 TO CHAR 函数 获取 每 一 个 日 期 分 别 是 星期 几 ， 然 后 统计 每 个 “星期 x*” 出 现 的 


次 数 。 最 终 的 结果 如 下 所 示 。 


select to_char( 
cast( 
date trunc('year',current date) 
as date) + gs.id-1,'DAY') as start dates, 
count(*) 
from generate series(1,366) gs(id) 
where gs.id «- (cast 
( date trunc('year',current date) + 
interval '12 month' as date) - 
cast(date trunc('year',current date) 
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as date)) 
group by to_char( 
cast( 
date_trunc('year',current_date) 
as date) + gs.id-1,'DAY') 


START_DATE COUNT(*) 


FRIDAY 52 
MONDAY 52 
SATURDAY 53 
SUNDAY 52 
THURSDAY 52 
TUESDAY 52 
WEDNESDAY 52 
SQL Server 





WITH 递归 查询 视图 x 里 的 内 岁 视 图 TMP 返回 当前 年 份 的 第 一 天 ， 如 下 所 示 。 








select cast( 
cast(year(getdate()) as varchar) + '-01-01' 
as datetime) start_date 
from t1 


START_DATE 


01-JAN-2005 


得 到 当前 年 份 的 第 一 天 之 后 ， 再 为 START_DATE 加 上 一 年 ， 这 样 我 们 就 知道 了 开始 日 期 和 结 
束 日 期 。 我 们 需要 知道 这 两 个 日 期 ， 因 为 需要 生成 这 一 年 中 的 每 一 天 。START_DATE 和 END_ 
DATE 如 下 所 示 。 


select start date, 
dateadd(year,1,start date) end date 
from ( 
select cast( 
cast(year(getdate()) as varchar) + '-01-01' 
as datetime) start date 





from t1 
) tmp 


START DATE END DATE 


01-JAN-2005 01-JAN-2006 


下 一 步 ， 为 START DATE 加 上 一 天 ， 如 此 循环 往复 ， 直 到 它 等 于 END_DATE。 如 下 展示 了 WITH 
递归 查询 视图 X 返 回 的 结果 集 的 一 部 分 。 


with x (start_date,end_date) 
as ( 
select start date, 
dateadd(year,1,start date) end date 
from ( 
select cast( 
































最 后 一 步 是 针对 WITH 递归 查询 视图 X 的 返回 结果 调用 DAYNAME 函数 ， 并 统计 


cast(year(getdate()) as varchar) + '-01-01 


as datetime) start date 
from t1 
) tmp 

union all 
select dateadd(day,1,start date), end, date 

from x 
where dateadd(day,1,start date) < end date 
) 
select * from x 
OPTION (MAXRECURSION 366) 


START DATE END DATE 

01-JAN-2005 01-JAN-2006 
02-JAN-2005 01-JAN-2006 
03-JAN-2005 01-JAN-2006 


29-JAN-2005 01-JAN-2006 
30-JAN-2005 01-JAN-2006 
31-JAN-2005 01-JAN-2006 


01-DEC-2005 01-JAN-2006 
02-DEC-2005 01-JAN-2006 
03-DEC-2005 01-JAN-2006 


29-DEC-2005 01-JAN-2006 
30-DEC-2005 01-JAN-2006 
31-DEC-2005 01-JAN-2006 




















出 现 的 次 数 。 最 终结 果 如 下 所 示 。 


with x(start_date,end_date) 
as ( 
select start_date, 
dateadd(year,1,start_date) end_date 
from ( 
select cast( 


cast(year(getdate()) as varchar) + '-01-01' 


as datetime) start_date 
from t1 
) tmp 
union all 
select dateadd(day,1,start date), end date 
from x 
where dateadd(day,1,start date) < end date 
) 
select datename(dw,start date), count(*) 
from x 
group by datename(dw,start date) 
OPTION (MAXRECURSION 366) 


START DATE — COUNT(*) 


p 


每 


个 “星期 x” 
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FRIDAY 52 


MONDAY 52 

SATURDAY 53 

SUNDAY 52 

THURSDAY 52 

TUESDAY 52 

WEDNESDAY 52 

+ sl 一 -人 一 人 ` * s 

8.7 计算 当前 记录 和 下 一 条 记录 之 间 的 日 期 差 
1. 问题 


计算 两 个 日 期 之 间 相 差 多 少 天 (特别 是 当 两 者 分 别 存储 于 不 同 的 行 的 时 候 )。 例 如 ， 对 于 
DEPTNO 等 于 10 的 部 门 的 每 一 个 员工 ， 你 希望 计算 出 他 们 的 入 职 日 期 之 间 相 差 多 少 天 。 

2. 解决 方案 

要 解决 本 问题 有 一 个 诀窍 是 ， 在 早 于 当前 入 职 时 间 的 所 有 记录 里 找 出 HIREDATE 的 最 小 值 。 
如 此 一 来 ， 剩 下 的 工作 就 是 利用 8.2 节 里 提 到 的 技巧 来 计算 出 两 个 日 期 之 间 相 差 多 少 天 。 
DB2 

使 用 标量 子 查询 找 出 相对 于 当前 HIREDATE 的 下 一 个 HIREDATE。 然 后 ， 调 用 DAYS 函数 计算 
两 个 日 期 之 间 相 差 多 少 天 。 














1 select x.*, 
2 days(x.next_hd) - days(x.hiredate) diff 
3 from ( 
4 select e.deptno, e.ename, e.hiredate, 
5 (select min(d.hiredate) from emp d 
6 where d.hiredate » e.hiredate) next hd 
7 from emp e 
8 where e.deptno - 10 
9 )x 
MySQL 和 SQL Server 


使 用 标量 子 查 询 找 出 相对 于 当前 HIREDATE 的 下 一 个 HIREDATE。 然 后 ， 调 用 DATEDIFF 函数 
计算 两 个 日 期 之 间 相 差 多 少 天 。 下 面 的 代码 里 以 SQL Server 版 本 的 DATEDIFF 函数 为 例 。 














1 select x.*, 

2 datediff(day,x.hiredate,x.next_hd) diff 
3 from ( 

4 select e.deptno, e.ename, e.hiredate, 

5 (select min(d.hiredate) from emp d 

6 where d.hiredate » e.hiredate) next hd 
7 from emp e 
8 where e.deptno - 10 
9 


)x 


对 于 MySQL 版 本 的 DATEDIFF 函数 ， 我 们 需要 省 略 第 一 个 参数 day， 并 把 剩 下 的 两 个 参数 
的 顺序 颠倒 过 来 。 


2 datediff(x.next hd, x.hiredate) diff 

















Oracle 
对 于 Oracle 8i 及 后 续 版 本 ， 使 用 窗口 国 数 LEAD OVER 访问 相对 于 当前 HIREDATE 的 下 一 个 
HIREDATE， 然 后 执行 减法 运算 。 


1 select ename, hiredate, next hd, 

2 next hd - hiredate diff 

3 from ( 

4 select deptno, ename, hiredate, 

5 lead(hiredate)over(order by hiredate) next hd 
6 from emp 

7 ) 

8 


where deptno-10 





对 于 Oracle 8; 及 更 早 的 版 本 ， 则 需要 采用 下 面 的 PostgreSQL 解决 方案 。 




















PostgreSQL 
使 用 标量 子 查 询 找 出 相对 于 当前 HIREDATE 的 下 一 个 HIREDATE。 然 后 ， 直 接 利 用 减法 运算 得 
出 两 者 相差 多 少 天 。 
1 select x.*, 
2 x.next hd - x.hiredate as diff 
3 from ( 
4 select e.deptno, e.ename, e.hiredate, 
5 (select min(d.hiredate) from emp d 
6 where d.hiredate » e.hiredate) as next hd 
7 from emp e 
8 where e.deptno - 10 
9 )x 


3. 讨论 

DB2, MySQL, PostgreSQL fe SQL Server 

除了 语法 上 的 差别 ， 所 有 这 些 解决 方案 的 做 法 是 相同 的 : 使 用 标量 子 查询 找 出 相对 于 当前 
HIREDATE 的 下 一 个 HIREDATE， 然 后 使 用 本 章 8.2 节 里 用 过 的 技巧 计算 出 两 个 日 期 之 间 相 差 








多 少 天 。 
Oracle 
窗口 函数 LEAD OVER 非常 有 用 ， 它 可 以 访问 “未 来 ”的 行 (“未 来 ”是 相对 于 当前 行 而 言 


的 





， 由 ORDER BY 子 句 决定 )。 不 必 使 用 额外 的 连接 查询 就 可 以 访问 当前 行 前 后 的 行 数 据 ， 


这 种 能 力 有 助 于 我 们 写 出 更 高 效 、 可 读 性 更 好 的 代码 。 当 使 用 窗口 函数 时 ， 要 记 住 它们 
是 在 WHERE 子 句 之 后 才 被 评估 执行 的 ， 这 就 是 为 什么 本 解决 方案 需要 一 个 内 嵌 视 图 。 如 
果 我 们 把 过 滤 DEPTNO 的 动作 移 到 内 和 坐视 图 里 面 的 话 ， 结 果 就 不 一 样 了 (就 变 成 了 只 考虑 
DEPTNO 等 于 10 的 员工 的 HIREDATE), >š F Oracle 的 LEAD 和 LAG 函数 ， 需 要 特别 指出 的 一 
点 是 它们 对 于 重复 项 的 处 理 。 在 前 言 部 分 我 提 到 过 ， 本 书 的 实例 都 不 包含 “防御 性 代码 ”， 
因为 有 太 多 无 法 预见 的 状况 都 可 能 导致 代码 无 法 正常 执行 。 也 就 是 说 ， 即 使 我 们 能 预见 到 
每 一 种 可 能 出 现 的 问题 ， 但 最 终 写 出 的 SQL 却 可 能 已 经 元 繁 到 不 具有 可 读 性 。 因 此 ， 在 大 
多 数 情况 下 ， 一 个 解决 方案 的 意义 在 于 它 提 供 了 一 种 技巧 : 我 们 能 将 其 用 于 线 上 系统 ， 但 
是 又 必须 事先 做 好 测试 ， 并 针对 具体 的 数据 做 出 必要 的 调整 。 对 于 本 例 而 言 ， 有 一 种 情况 
稍 后 需要 简单 讨论 一 下 ， 因 为 针对 它 的 变通 方案 不 是 那么 显而易见 ， 对 于 不 熟悉 Oracle 的 
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读者 而 言 尤 其 如 此 。 本 例 中 EMP 表 里 不 存在 重复 的 HIREDATE， 但 是 在 一 个 表 里 出 现 重复 的 
日 期 当然 是 可 能 的 〈 并 且 非 常 可 能 )。 考 虑 DEPTNO 等 于 10 的 员工 及 其 对 应 的 HIREDATE, 


select ename，hiredate 
from emp 

where deptno=10 

order by 2 

















ENAME HIREDATE 


CLARK 09-JUN-1981 
KING 17-NOV-1981 
MILLER 23-JAN-1982 


为 了 讨论 的 需要 ， 我 们 插入 4 条 重复 数据 ， 这 样 就 有 (包括 KING 在 内 的 ) 5 个 员工 的 
HIREDATE 都 是 11 月 17 日 了 。 





insert into emp (empno,ename,deptno,hiredate) 
values (1,'ant',10,to date('17-NOV-1981')) 


insert into emp (empno,ename,deptno,hiredate) 
values (2,'joe',10,to date('17-NOV-1981')) 


insert into emp (empno,ename,deptno,hiredate) 
values (3,'jim',10,to date('17-NOV-1981')) 


insert into emp (empno,ename,deptno,hiredate) 
values (4,'choi',10,to date( '17-NO0V-1981')) 


select ename, hiredate 
from emp 

where deptno-10 

order by 2 


ENAME X HIREDATE 

CLARK .09-JUN-1981 
ant 17-NOV-1981 
joe 17-NOV-1981 
KING — 17-NOV-1981 
jim 17-NOV-1981 
choi | 17-NOV-1981 
MILLER 23-JAN-1982 


现在 DEPTNO 等 于 10 的 部 门 里 就 有 不 止 一 个 人 的 HIREDATE 是 同一 天 了 。 如 果 仍 然 使 用 上 述 


m 


坚决 方案 (但 是 要 把 DEPTNO EIES ERR ARREA, RRR DEPTNO 等 于 10 的 
员工 及 其 HIREDATE), ， 返 回 的 结果 集 就 变 成 如 下 所 示 的 输出 内 容 。 


select ename, hiredate, next hd, 
next hd - hiredate diff 
from ( 
select deptno, ename, hiredate, 
lead(hiredate)over(order by hiredate) next hd 
from emp 
























































where deptno=10 


) 
ENAME HIREDATE NEXT HD DIFF 
CLARK 909-JUN-1981 17-NOV-1981 161 
ant  17-NOV-1981 17-NOV-1981 0 
joe . 17-NOV-1981 17-NOV-1981 0 
KING 17-NOV-1981 17-NOV-1981 0 
jim — 17-NOV-1981 17-NOV-1981 0 
choi 17-NOV-1981 23-JAN-1982 67 
MILLER 23-JAN-1982 (null) (null) 


看 一 下 HIREDATE 相同 的 5 个 员工 ， 他 们 中 有 4 个 人 的 DIFF 值 是 0。 这 显然 不 正确 。 对 
于 HIREDATE 相同 的 员工 而 言 ， 应 该 与 下 一 个 不 同 的 HIREDATE 相 比较 ， 例 如 HIREDATE 是 
11 月 17 日 的 员工 要 与 MILLER 的 HIREDATE 相 比较 。 问 题 的 根源 在 于 LEAD 函数 仅仅 按照 
HIREDATE 排序 ， 却 不 会 自动 去 重 。 因 此 ， 如 果 把 ANT 的 HIREDATE 与 JOE 的 相 比较 ， 相 差 
的 天 数 就 是 0， 如 此 一 来 ANT 的 DIFF 值 就 变 成 0 了 。 所 幸 Oracle 已 经 为 这 种 情况 提供 了 
一 个 简单 的 变通 方案 。 当 调用 LEAD 函数 的 时 候 ， 我 们 可 以 传递 一 个 参数 用 于 指定 “未 来 
A or en i 和 之后， 等 等 )。 因 此 ， 对 于 员工 ANT, 
需要 跨 过 5 行 ， 而 不 是 一 行 (我 们 希望 跳 过 所 有 重复 的 HIREDATE) ， 去 看 一 下 MILLER 的 
HIREDATE。 员工 JOE 距离 Md 有 4 行 的 距离 JM Jl] 2E 347, KING 2E 2 fT, CHOI 
o qn LN UT i ESTO 
值 作为 参数 传递 给 LEAD 国 数 即 可 。 该 解决 方案 如 下 所 示 。 
select ename, hiredate, next hd, 
next hd - hiredate diff 
from ( 
select deptno, ename, hiredate, 
lead(hiredate,cnt-rn«1)over(order by hiredate) next hd 
from ( 
select deptno,ename,hiredate, 


count(*)over(partition by hiredate) cnt, 
row number()over(partition by hiredate order by empno) rn 









































from emp 

where deptno-10 

) 

) 
ENAME HIREDATE NEXT. HD DIFF 
CLARK 09-JUN-1981 17-NOV-1981 161 
ant 17-NOV-1981 23-JAN-1982 67 
joe 17-NOV-1981 23-JAN-1982 67 
jim 17-NOV-1981 23-JAN-1982 67 
choi 17-NOV-1981 23-JAN-1982 67 
KING 17-NOV-1981 23-JAN-1982 67 
MILLER 23-JAN-1982 (null) (null) 


现在 我 们 能 得 到 正确 的 计算 结果 了 。 所 有 HIREDATE 相同 的 员工 都 会 和 下 一 个 不 同 的 
HIREDATE 相 比较 ， 而 不 会 匹配 到 一 个 相同 的 HIREDATE 值 。 如 果 这 个 末代 方案 不 是 那么 容易 
































WRI 





理解 ， 不 妨 把 上 述 查 询 分 解 开 来 看 。 先 从 内 艇 视 


select deptno,ename,hiredate, 
count(*)over(partition by hiredate) cnt, 
row number()over(partition by hiredate order by empno) rn 
from emp 
where deptno-10 


开始 。 














DEPTNO ENAME HIREDATE CNT RN 
10 CLARK .09-JUN-1981 1 1 
10 ant 17-NOV-1981 5 1 
10 joe 17-NOV-1981 5 2 
10 jim 17-NOV-1981 5 3 
10 choi © 17-NOV-1981 5 4 
10 KING — 17-NOV-1981 5 5 
10 MILLER 23-JAN-1982 1 1 


窗口 函数 COUNT OVER 计算 每 一 种 HIREDATE 值 出 现 的 次 数 ， 并 为 每 一 行 记录 返回 该 值 。 对 于 
那个 重复 的 HIREDATE, CNT 的 值 都 是 5。 窗口 函数 ROW, NUMBER OVER 按照 EMPNO 为 每 一 个 员 
工 排名 。 排 名 按照 HIREDATE 分 区 ， 除 非 有 重复 的 HIREDATE 出 现 ， 否 则 每 个 员工 对 应 的 RN 
值 都 是 1。 现 在 ， 所 有 重复 数据 都 被 分 组 计数 并 算出 其 在 分 组 里 的 排名 ， 而 该 排名 值 可 以 
用 于 度量 当前 HIREDATE 到 下 一 个 HIREDATE (MILLER 的 HIREDATE) 的 距离 。 调 用 LEAD ERI 
数 时 ， 我 们 通过 从 CNT 里 减 去 RN 值 并 加 1 来 得 出 该 距离 值 。 


select deptno, ename, hiredate, 
cnt-rn+1 distance to miller, 
lead(hiredate,cnt-rn*1)over(order by hiredate) next hd 
from ( 
select deptno,ename,hiredate, 
count(*)over(partition by hiredate) cnt, 
row number()over(partition by hiredate order by empno) rn 
from emp 
where deptno-10 























DEPTNO ENAME HIREDATE DISTANCE TO MILLER NEXT HD 

10 CLARK .09-JUN-1981 1 17-NOV-1981 
10 ant 17-NOV-1981 5 23-JAN-1982 
10 joe 17-NOV-1981 4 23-JAN-1982 
10 jim 17-NOV-1981 3 23-JAN-1982 
10 choi © 17-NOV-1981 2 23-JAN-1982 
10 KING — 17-NOV-1981 1 23-JAN-1982 
10 MILLER 23-JAN-1982 1 (null) 


如 上 所 示 ， 通 过 传递 适当 的 距离 值 以 跳 过 若干 行 重复 数据 ，LEAD 函数 就 能 实现 正确 的 日 期 
比较 了 。 
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日 期 处 理 





本 章 介绍 与 日 期 检索 和 修改 相关 的 实例 。 日 期 查询 是 非常 常见 的 。 因 此 ， 我 们 需要 知道 日 
期 处 理 的 基本 思路 ， 并 深入 理解 各 种 关系 数据 库 管理 系统 提供 的 日 期 处 理 函 数 。 本 章 的 实 
例 能 为 我 们 未 来 的 工作 打下 坚实 的 基础 ， 帮 助 我 们 处 理 更 为 复杂 的 日 期 和 时 间 查 询 。 


在 开始 讲述 这 些 实例 之 前 ， 我 想 再 强调 一 次 如 何 使 用 本 书 提供 的 解决 方案 解决 实际 问题 
(我 在 前 言 部 分 也 提 到 过 这 一 点 )。 我 希望 你 能 有 “全 局 视角 ”。 例 如 ， 某 个 实例 解决 了 针 
对 当前 月 份 的 一 个 问题 ， 那 么 我 们 其 实 可 以 把 同样 的 思路 运用 在 任何 一 个 月 份 上 (需要 做 
一 些 细微 调整 )， 而 不 是 局 限于 实例 里 选择 的 那个 月 份 。 我 希望 你 能 把 本 书 提供 的 实例 当 
作 解 题 指南 ， 而 不 是 唯一 正确 的 答案 。 我 没有 办 法 在 本 书 中 宫 括 全 部 问题 的 答案 ， 但 是 如 
果 深 入 理解 了 书 中 给 出 的 解决 方案 ， 那 么 在 此 基础 上 加 以 变通 ， 使 之 适用 于 具体 问题 应 该 
不 是 那么 困难 。 我 也 希望 你 能 认真 思考 一 下 ， 除 了 书 中 提供 的 解决 方案 ， 是 否 还 有 其 他 替 
代 方 案 。 例 如 ， 假 设 我 在 某 个 解决 方案 里 用 到 了 一 种 关系 数据 库 管理 系统 的 专 有 函数 ， 那 
么 花 一 点 时 间 和 精力 想 一 想 是 否 还 有 其 他 替代 方案 也 是 值得 的 。 相 较 于 本 书 中 提供 的 解决 
方案 ， 新 的 办 法 或 许 更 高 效 ， 也 可 能 显得 稍微 笨 一 点 。 无 论 如 何 ， 知 道 了 手头 有 哪些 可 选 
方案 有 助 于 我 们 成 为 更 好 的 SQL 程序 员 。 
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本 章 的 实例 只 会 用 到 基本 的 日 期 数据 类 型 。 如 果 你 需要 使 用 更 复杂 的 日 期 数 
。 据 类 型 ， 则 需要 在 本 章 解 决 方案 的 基础 上 做 出 适当 的 调整 。 
9.1 判断 闻 年 


1. 问题 
判断 当前 年 份 是否 羡 年 。 
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2. 解决 方案 


如 果 你 已 经 有 了 一 段 时 间 的 SQL 编程 经 验 ， 那 么 你 肯定 知道 本 问题 有 多 种 解法 。 我 也 尝试 
能 是 最 为 简单 的 。 下 
面 的 解决 方案 仅仅 检查 2 月 的 最 后 一 天 : 如 果 有 2 月 29 日 ， 则 当前 年 份 是 半年 。 


过 多 种 解决 方案 ， 它 们 都 能 给 出 正确 答案 ， 但 是 本 实例 提供 的 方案 可 




















DB2 





使 用 WITH 子 句 递归 查询 返回 2 月 的 每 一 天 ， 然 后 调用 聚合 函数 MAX 确认 2 月 的 最 后 一 天 。 





1 with x (dy,mth) 

2 as ( 

3 select dy, month(dy) 
4 from ( 

5 select (current_date - 
6 dayofyear(current_date) days +1 days) 
7 +1 months as dy 

8 from t1 

9 ) tmp1 

10 union all 

11 select dy+1 days, mth 


12 from x 
13 where month(dy«1 day) = mth 
14 ) 
15 select max(day(dy)) 
16 from x 
Oracle 


使 用 LAsT. DAY 函数 找 出 2 月 的 最 后 一 天 。 


1 select to_char( 

2 last_day(add_months(trunc(sysdate,'y'),1)), 
3 'DD') 

4 from ti 


PostgreSQL 


使 用 GENERATE_SERIES 国 数 返 回 2 月 的 每 一 天 ， 然 后 调用 聚合 国 数 MAX 找 出 2 月 的 最 后 





一 天 。 


1 select max(to_char(tmp2.dy+x.id,'DD')) as dy 

2 from ( 

3 select dy, to char(dy,'MM') as mth 

4 from ( 

5 select cast(cast( 

6 date trunc('year',current date) as date) 
7 * interval '1 month' as date) as dy 
8 from t1 

9 ) tmp1 

0 ) tmp2, generate series (0,29) x(id) 

1 where to char(tmp2.dy«x.id, ' MM') = tmp2.mth 


MySQL 
使 用 LAST. DAY 函数 找 出 2 月 的 最 后 一 天 。 


1 select day( 
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2 last_day( 
3 date_add( 
4 date_add( 
5 date_add(current_date, 
6 interval -dayofyear(current date) day), 
7 interval 1 day), 
8 interval 1 month))) dy 
9 from ti 
SQL Server 


使 用 WITH 递归 查询 返回 2 月 的 每 一 天 ， 然 后 调用 聚合 函数 MAX 确认 2 月 的 最 后 一 天 。 


1 with x (dy,mth) 

2 as ( 

3 select dy, month(dy) 

4 from ( 

5 select dateadd(mm,1,(getdate()-datepart(dy,getdate()))41) dy 
6 

7 

8 


from t1 
) tmpi 

union all 
9 select dateadd(dd,1,dy), mth 
10 from x 
11 where month(dateadd(dd,1,dy)) = mth 
12 ) 
13 select max(day(dy)) 
14 from x 

3. 讨论 


DB2 
递归 视图 X HL HJHMW S] TMP 按照 下 面 的 步骤 返回 2 月 的 第 一 天 。 


(1) 从 当前 日 期 开始 ; 

(2) 调用 DAYOFYEAR 函数 确认 当前 日 期 是 当前 年 份 的 第 几 天 ， 

(3) 从 当前 日 期 里 减 去 上 述 步骤 算出 的 那个 数字 以 得 到 上 一 年 的 12 H 31 日， 然后 加 上 1 天 
得 到 当前 年 份 的 1 月 1 日 ; 

(4) 再 加 上 1 个 月 得 到 2 月 1 日 。 


上 述 步 又 的 运算 结果 如 下 所 示 。 


select (current date - 
dayofyear(current date) days +1 days) +1 months as dy 
































from t1 


01-FEB-2005 


然后 ， 调 用 MONTH PAER ARAILE TMP 返回 的 日 期 对 应 的 月 份 。 


select dy, month(dy) as mth 
from ( 
select (current_date - 
dayofyear(current date) days +1 days) +1 months as dy 
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from t1 
) tmp1 


DY MTH 


01-FEB-2005 2 


到 此 为 止 的 结果 只 是 作为 生成 2 月 的 每 一 天 的 递归 操作 的 起 点 。 为 了 获得 2 月 的 每 一 天 ， 
不 断 为 DY 加 上 1 天， 直到 月 份 不 再 是 2 月 为 止 。 该 WITH 计算 的 部 分 结果 如 下 所 示 。 


with x (dy,mth) 
as ( 
select dy, month(dy) 
from ( 
select (current_date - 
dayofyear(current_date) days +1 days) +1 months as dy 
from t1 





union all 
select dy«1 days, mth 
from x 
where month(dy-1 day) = mth 


select dy,mth 
from x 


DY MTH 


01-FEB-2005 2 
10-FEB-2005 2 
28-FEB-2005 2 


最 后 ， 针 对 DY 列 调用 MAX 函数 返回 2 月 的 最 后 一 天 ;如果 是 29 日 的 话 ， 则 当前 年 份 是 
HE. 

Oracle 

首先 ， 调 用 TRUNC 函数 找 出 当前 年 份 的 第 一 天 。 


select trunc(sysdate, 'y') 
from t1 











01-JAN-2005 


由 于 1 月 1 日 是 一 年 中 的 第 一 天 ， 下 一 步 就 是 在 此 基础 上 加 上 1 个 月 得 到 2 月 1 日 。 


select add_months(trunc(sysdate,'y'),1) dy 
from t1 








01-FEB-2005 
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然后 ， 调 用 LasT pav 找 出 2 月 的 最 后 一 天 。 


select last_day(add_months(trunc(sysdate,'y'),1)) dy 





from t1 
DY 
28-FEB-2005 
最 后 ， 调 用 TO CHAR 得 到 28 或 者 29 (这 一 步 不 是 必需 的 )。 
PostgreSQL 

















首先 观察 内 艇 视图 TMP1 返回 的 结果 。 调 用 DATE_TRUNC 函数 得 到 当前 年 份 的 第 一 天 ， 并 将 
其 转换 为 DATE 类 型 。 


select cast(date_trunc('year',current_date) as date) as dy 
from t1 

















01-JAN-2005 


然后 ， 在 当前 年 份 第 一 天 的 基础 上 加 上 1 个 月 ， 得 到 2 月 的 第 一 天 ， 并 转换 为 DATE 类 型 。 


select cast(cast( 
date trunc('year',current date) as date) 
* interval '1 month' as date) as dy 





from t1 


01-FEB-2005 


BA, MARIE TMP1 里 返回 DY， 并 依据 DY 计算 出 月 份 的 值 。 调 用 TO. CHAR 函数 返回 月 
份 的 值 。 


select dy, to_char(dy,'MM') as mth 
from ( 
select cast(cast( 
date_trunc('year',current_date) as date) 
+ interval '1 month' as date) as dy 











from t1 
) tmp1 


DY MTH 


01-FEB-2005 2 
AEA IEBSTEERAS ARX. Y I chi E| TMP2 的 结果 集 。 下 一 步 要 用 到 一 个 非常 有 用 的 函数 
GENERATE, SERIES 来 生成 29 行 数据 (EM 1 逐一 递增 到 29)。GENERATE_SERIES 函数 返回 的 
每 一 行 ( 别 名 为 X) SIRE] TMP2 的 DY 相 加 。 部 分 结果 如 下 所 示 。 


select tmp2.dy+x.id as dy, tmp2.mth 
from ( 
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select dy, to_char(dy,'MM') as mth 
from ( 
select cast(cast( 
date trunc('year',current date) as date) 
* interval '1 month' as date) as dy 
from t1 
) tmp1 
) tmp2, generate series (0,29) x(id) 
where to char(tmp2.dy«x.id, 'MM') = tmp2.mth 


DY MTH 
01-FEB-2005 602 
10-FEB-2005 02 
28-FEB-2005 02 


最 后 ， 调 用 MAX 函数 找 出 2 月 的 最 后 一 天 。 针 对 该 日 期 值 调用 To, cHAR 函数 将 得 到 28 或 
者 29。 


MySQL 
首先 找 出 当前 年 份 的 第 一 天 : 先 计算 出 当前 日 期 是 当前 年 份 的 第 几 天 ， 用 当前 日 期 减 去 该 
值 ， 然 后 再 加 上 1 天 。DATE_ADD 函数 能 完成 这 一 步 。 


select date_add( 
date_add(current_date, 
interval -dayofyear(current_date) day), 
interval 1 day) dy 














from t1 


01-JAN-2005 


接着 ， 再 次 调用 DATE ADD 函数 在 上 述 计 算 结 果 的 基础 上 加 上 1 个 月 。 


select date_add( 
date_add( 
date_add(current_date, 
interval -dayofyear(current_date) day), 
interval 1 day), 
interval 1 month) dy 








from t1 


01-FEB-2005 


现在 得 到 了 2 月 1 日 的 日 期 值 ， 接 着 调用 LAST_DAY 函数 找 出 2 月 的 最 后 一 天 。 


select Last_day( 
date_add( 
date_add( 
date_add(current_date, 
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interval -dayofyear(current_date) day), 
interval 1 day), 
interval 1 month)) dy 

from t1 


28-FEB-2005 
最 后 ， 调 用 DAY 函数 返回 28 或 者 29 (这 一 步 不 是 必需 的 ) 。 


SQL Server 

该 解决 方案 利用 WITH 递归 查询 生成 2 月 的 每 一 天 。 第 一 步 先 找 出 2 月 的 第 一 天 。 为 达到 此 
目的 ， 先 找 出 当前 年 份 的 第 一 天 : 计算 出 当前 日 期 是 当前 年 份 的 第 几 天 ， 用 当前 日 期 减 去 
该 值 ， 然 后 再 加 上 1 天 。 既 然 有 了 当前 年 份 的 第 一 天 ， 调 用 DATEADD 函数 加 上 1 个 月 ， 就 
能 得 到 2 月 的 第 一 天 了 。 


select dateadd(mm,1,(getdate()-datepart(dy,getdate()))+1) dy 
from t1 


























01-FEB-2005 
接着 ， 返 回 2 月 的 第 一 天 ， 并 计算 出 该 日 期 对 应 月 份 的 数值 形式 。 


select dy, month(dy) mth 
from ( 
select dateadd(mm,1,(getdate()-datepart(dy,getdate()))+1) dy 
from t1 
) tmp1 

















DY MTH 


01-FEB-2005 2 


然后 利用 WITH FARDE dp PE, DAAR S] TMP1 返回 的 Dv 加 上 1， 直 到 日 期 对 应 的 
月 份 不 再 是 2 月 ， 部 分 结果 如 下 所 示 。 


with x (dy,mth) 
as ( 

select dy, month(dy) 

from ( 
select dateadd(mm,1,(getdate()-datepart(dy,getdate()))41) dy 

from t1 

) tmp1 

union all 
select dateadd(dd,1,dy), mth 

from x 

where month(dateadd(dd,1,dy)) = mth 
) 


select dy,mth from x 



































DY MTH 





01-FEB-2005 602 
10-FEB-2005 02 
28-FEB-2005 02 


现在 得 到 了 2 月 的 每 一 天 ， 最 后 调用 MAX 函数 看 一 下 最 后 一 天 是 28 日 还 是 29 日 。 还 可 以 
调用 DAY 函数 返回 数字 28 或 者 29， 而 不 是 一 个 日 期 值 ， 不过， 这 Tad. 


92 ”计算 一 年 有 多 少 天 


1. 问题 

计算 当前 年 份 有 多 少 天 。 

2. 解决 方案 

计算 当前 年 份 有 多 少 天 ， 等 同 于 计算 下 一 年 的 第 一 天 和 当前 年 份 的 第 一 天 之 间 的 差 值 (以 
天 为 单位 )。 对 于 下 面 的 所 有 解决 方案 ， 求 解 步骤 都 如 下 所 示 。 

(1 找到 当前 年 份 的 第 一 天 ; 

(2) 在 上 述 结果 的 基础 上 加 上 1 年 (以 得 到 下 一 年 的 第 一 天 ) ; 

(3) 用 第 2 步 得 到 的 结果 减 去 第 一 步 得 到 的 结果 。 

下 面 的 各 种 解决 方案 的 不 同 之 处 仅 在 于 上 述 各 步骤 使 用 的 内 置 函 数 不 一 样 。 

DB2 

使 用 DAYOFYEAR 函数 找 出 当前 年 份 的 第 一 天 ， 并 使 用 DAYS 函数 得 出 当前 年 份 有 多 少 天 。 


1 select days((curr year + 1 year)) - days(curr year) 
2 from ( 
3 select (current date - 












































7 

















4 dayofyear(current date) day + 
5 1 day) curr_year 

6 from ti 

7 ) x 


使 用 TRUNC 函数 找 出 当前 年 份 的 第 一 天 ， 并 调用 ADD_MONTHS 函数 得 到 下 一 年 的 第 一 天 。 


1 select add_months(trunc(sysdate,'y'),12) - trunc(sysdate,'y') 
2 from dual 








PostgreSQL 
使 用 DATE_TRUNC 国 数 找 出 当前 年 份 的 第 一 天 ， 然 后 借助 INTERVAL 关键 字 计 算出 下 一 年 的 
第 一 天 。 


1 select cast((curr year + interval '1 year') as date) - curr_year 























2 from ( 

3 select cast(date trunc('year',current date) as date) as curr year 
4 from ti 

5 )x 
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MySQL 
使 用 ADDDATE 函数 找 出 当前 年 份 的 第 一 天 。 调 用 DATEDIFF 函数 ， 并 借助 INTERVAL 关键 字 计 
算出 当前 年 份 有 多 少 天 。 


1 select datediff((curr_year + interval 1 year),curr_year) 

2 from ( 

3 select adddate(current date,-dayofyear(current date)+1) curr year 
4 from ti 

5 ) x 

















SQL Server 
使 用 DATEADD 函数 找 出 当前 年 份 的 第 一 天 。 调 用 DATEDIFF 国 数 计算 出 当前 年 份 有 多 少 天 。 


1 select datediff(d,curr year,dateadd(yy,1,curr year)) 


2 from ( 
3 select dateadd(d,-datepart(dy,getdate())+1,getdate()) curr_year 
4 from ti 
5 ) x 
3. 讨论 
DB2 





首先 找 出 当前 年 份 的 第 一 天 。 调 用 DAYOFYEAR 函数 计算 出 当前 日 期 是 当前 年 份 的 第 几 天 ， 
用 当前 日 期 减 去 该 值 就 能 得 到 上 一 年 的 最 后 一 天 ， 然 后 加 上 LX. 


select (current date - 
dayofyear(current date) day + 
1 day) curr year 
from t1 




















CURR, YEAR 


01-JAN-2005 
现在 得 到 了 当前 年 份 的 第 一 天 ， 只 要 在 此 基础 上 加 上 1 年 ， 就 能 得 到 下 一 年 的 第 一 天 。 然 
后 ， 用 下 一 年 的 第 一 天 减 去 当前 年 份 的 第 一 天 ， 就 能 得 到 答案 了 。 
Oracle 
首先 找 出 当前 年 份 的 第 一 天 ， 直 接 调用 内 置 函 数 TRUC 并 把 Y 作为 第 二 个 参数 〈 因 而 会 截 
断 当 前 系统 日 期 值得 到 当前 年 份 的 第 一 天 ) 即 可 。 


select select trunc(sysdate,'y') curr_year 
from dual 























CURR_YEAR 


01-JAN-2005 
然后 ， 在 上 述 计算 结果 的 基础 上 加 上 1 年 得 到 下 一 年 的 第 一 天 。 最 后 ， 两 个 日 期 相 减 得 到 
当前 年 份 有 多 少 天 。 


PostgreSQL 
先 找到 当前 年 份 的 第 一 天 。 为 此 ， 要 调用 DATE_TRUNC 国 数 ， 如 下 所 示 。 
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select cast(date_trunc('year',current_date) as date) as curr_year 
from t1 


CURR_YEAR 


01-JAN-2005 
然后 ， 在 上 述 计 算 结 果 的 基础 上 简单 地 加 上 1 年 ， 计 算出 下 一 年 的 第 一 天 。 接 着 ， 只 需 
要 把 两 个 日 期 相 减 。 要 记得 用 靠 后 的 日 期 减 去 较 早 的 日 期 。 得 到 的 结果 就 是 当前 年 份 有 
多 少 天 。 
MySQL 
第 一 步 是 找 出 当前 年 份 的 第 一 天 。 调 用 DAYOFYEAR 国 数 得 到 当前 日 期 是 当前 年 份 的 第 几 天 。 
用 当前 日 期 减 去 该 值 ， 然 后 加 上 1 天 。 


select adddate(current_date, -dayofyear(current_date)+1) curr year 









































from t1 
CURR, YEAR 
01-JAN-2005 
现在 得 到 了 当前 年 份 的 第 一 天 ， 下 一 步 是 在 此 基础 上 加 上 1 年 得 到 下 一 年 的 第 一 天 。 然 
后 ， 用 下 一 年 的 第 一 天 减 去 当前 年 份 的 第 一 天 。 得 到 的 结果 就 是 当前 年 份 有 多 少 天 。 
SQL Server 


第 一 步 是 找 出 当前 年 份 的 第 一 天 。 调 用 DATEADD 和 DATEPART 国 数 从 当前 日 期 减 去 当前 年 份 
已 经 过 去 的 天 数 ， 然 后 再 加 上 1 天 。 


select dateadd(d,-datepart(dy,getdate())+1,getdate()) curr_year 





from t1 
CURR_YEAR 
01-2N-2005 
现在 得 到 了 当前 年 份 的 第 一 天 ， 下 一 步 是 在 此 基础 上 加 上 1 年 得 到 下 一 年 的 第 一 天 。 然 








后 ， 用 下 一 年 的 第 一 天 减 去 当前 年 份 的 第 一 天 ， 得 到 的 结果 就 是 当前 年 份 的 有 多 少 天 。 


93 ”从 给 定 日 期 值 里 提取 年 月 日 时 分 秒 


1. 问题 

把 当前 日 期 值 分 解 为 六 个 部 分 : E. 月、 日 、 时 、 分 和 秒 ， 并 且 和 希望 结果 以 数字 的 形式 返 
回 。 

2. 解决 方案 

这 里 以 当前 日 期 为 例 。 但 是 ， 本 实例 适用 于 任何 其 他 日 期 值 。 在 第 1 章 ， 我 提 到 过 学 习 和 
利用 数据 库 内 置 函 数 的 重要 性 。 对 于 日 期 处 理 而 言 ， 这 一 点 尤其 重要 。 除 了 本 实例 提供 的 
做 法 ， 还 有 其 他 方式 能 够 从 给 定 日 期 值 里 提取 年 、 月 、 日 、 时 、 分 、 秒 等 时 间 单 位 。 总 
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之 ， 多 尝试 不 同 的 做 法 和 技巧 是 非常 有 益 的 。 


DB2 
DB2 实现 了 一 组 内 置 函 数 帮助 我 们 方便 地 提取 出 一 个 日 期 值 的 每 一 个 组 成 部 分 。 这 些 函数 
分 别 被 命名 为 HOUR、MINUTE、SECOND、DAY、MONTH 和 YEAR， 直 观 地 表明 它们 要 返回 的 时 间 
和 位 。 如 果 我 们 想 要 “天 ”， 那 就 调用 DAY 函数 ， 如 果 想 要 “小 时 ”， 那 就 调用 HOUR 函数 ， 
等 等 。 示 例如 下 。 






































ind 





1 select  hour( current timestamp ) hr, 
2 minute( current timestamp ) min, 
3 second( current timestamp ) sec, 
4 day( current timestamp ) dy, 
5 month( current timestamp ) mth, 
6 year( current timestamp ) yr 
7 from ti 


Oracle 


使 用 TO. CHAR 和 TO, NUMBER 函数 从 一 个 日 期 值 里 提取 各 种 时 间 单 位 。 


1 select to_number(to_char(sysdate,'hh24')) hour, 
2 to number(to char(sysdate, 'mi')) min, 

3 to number(to char(sysdate,'ss')) sec, 

4 to number(to char(sysdate, 'dd')) day, 

5 to, number(to, char(sysdate, 'mm')) mth, 

6 to number(to char(sysdate, 'yyyy')) year 
7 from dual 


PostgreSQL 
使 用 TO. CHAR 和 TO, NUMBER 函数 从 一 个 日 期 值 里 提取 各 种 时 间 单 位 。 


1 select to number(to char(current timestamp, 'hh24'),'99') as hr, 
2 to number(to  char(current timestamp, 'mi'),'99') as min, 

3 to number(to  char(current timestamp, 'ss'),'99') as sec, 

4 to number(to, char(current timestamp, 'dd'),'99') as day, 

5 to number(to, char(current timestamp, 'mm'),'99') as mth, 

6 to number(to  char(current timestamp, 'yyyy'),'9999') as yr 
7 from ti 


MySQL 








select date_format(current_timestamp,' %k') hr, 
date_format(current_timestamp, '%i') min, 
date format(current timestamp, '%s') sec, 
date format(current timestamp, 'Xd') dy, 
date format(current timestamp, 'Xm') mon, 
date format(current timestamp, 'XY') yr 
from t1 


"OU O QUN P 


SQL Server 
使 用 DATEPART 国 数 从 一 个 日 期 值 里 提取 各 种 时 间 单 位 。 





1 select datepart( hour, getdate()) hr, 
2 datepart( minute,getdate()) min, 
3 datepart( second,getdate()) sec, 
4 datepart( day, getdate()) dy, 
5 datepart( month, getdate()) mon, 
6 datepart( year, getdate()) yr 
7 from ti 


3. 讨论 

以 上 这 些 解决 方案 并 没有 什么 特别 之 处 ， 只 是 尽量 利用 了 数据 库 中 的 内 置 函数 。 我 们 应 该 
花 一 些 时 间 去 学 习 这 些 与 日 期 相关 的 国 数 。 不 过 ， 本 实例 的 各 个 解决 方案 仅仅 展示 了 这 些 
函数 的 部 分 功能 。 如 果 仔 细 研 究 的 话 ， 我 们 会 看 到 每 一 个 函数 都 能 接受 更 多 的 参数 ， 并 能 
返回 更 多 信息 ， 只 是 我 们 无 法 在 本 实例 里 一 一 演示 给 你 看 。 


94 计算 一 个 月 的 第 一 天 和 最 后 一 天 























1. 问题 
你 希望 知道 当前 月 份 的 第 一 天 和 最 后 一 天 。 
2. 解决 方案 





这 里 给 出 的 解决 方案 是 找 出 当前 月 份 的 第 一 天 和 最 后 一 天 。 其 实 ， 并 非 一 定 要 选择 当前 月 
份 。 略 微 改动 一 下 的 话 ， 本 方案 就 能 适用 于 任何 月 份 。 


DB2 
使 用 Dav 国 数 计算 出 当前 日 期 是 当前 月 份 的 第 几 天 。 用 当前 日 期 减 去 该 值 ， 并 加 上 1， 就 
得 到 了 当前 月 份 的 第 一 天 。 为 了 获取 当前 月 份 的 最 后 一 天 ， 再 次 针对 当前 日 期 调用 DAY 图 
数 ， 然 后 在 当前 日 期 的 基础 上 加 上 1 个 月 ， 并 减 去 上 述 DAY 函数 调用 的 返回 值 。 

1 select (current date - day(current date) day +1 day) firstday, 


2 (current date +1 month -day(current date) day) lastday 
3 from ti 
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Oracle 


使 用 TRUNC 函数 找 出 当前 月 份 的 第 一 天 ， 并 使 用 LAST. DAY 函数 找 出 当前 月 份 的 最 后 一 天 。 


1 select trunc(sysdate,'mm') firstday, 
2 last_day(sysdate) lastday 
3 from dual 














上 述 调用 TRUC 函数 会 丢掉 日 期 值 里 原本 包含 的 时 间 部 分 ， 而 LAST. DAY 函数 
。 则 会 保留 时 间 值 。 








PostgreSQL 
针对 当前 日 期 调用 DATE_TRUNC 函数 得 到 当前 月 份 的 第 一 天 。 既 然 知 道 了 当前 月 份 的 第 一 
天 ， 先 加 上 1 个 月 ， 再 减 去 1 天 ， 这 样 就 得 到 了 当前 月 份 的 最 后 一 天 。 








select firstday, 
cast(firstday + interval '1 month' 
- interval '1 day' as date) as lastday 


select cast(date trunc('month',current date) as date) as firstday 
from t1 


1 
2 

3 

4 from ( 
5 

6 

7 )x 

MySQL 

使 用 DATE, ADD 和 DAY 函数 计算 出 当前 日 期 是 当前 月 份 的 第 几 天 。 然 后 从 当前 日 期 里 减 去 该 
计算 结果 ， 并 加 1， 就 得 到 了 当前 月 份 的 第 一 天 。 为 了 得 到 当前 月 份 的 最 后 一 天 ， 则 使 用 
LAST DAY PAL, 











1 select date add(current date, 

2 interval -day(current date)«1 day) firstday, 
3 last day(current date) lastday 

4 from ti 


SQL Server 

使 用 DATEADD 和 DAY 函数 计算 出 当前 日 期 是 当前 月 份 的 第 几 天 。 然 后 从 当前 日 期 里 减 去 该 
计算 结果 ， 并 加 1， 就 得 到 了 当前 月 份 的 第 一 天 。 为 得 到 当前 月 份 最 后 一 天 ， 再 次 针对 当 
前 日 期 调用 DAY 函数 ， 然 后 再 次 调用 DATEADD 函数 在 当前 日 期 的 基础 上 加 上 1 个 月 ， 并 减 
去 上 述 调用 DAY 函数 的 返回 值 。 








1 select dateadd(day,-day(getdate())+1,getdate()) firstday, 
2 dateadd(day， 
3 -day(getdate( )), 
4 dateadd(month,1,getdate())) Lastday 
5 from ti 
3. 讨论 
DB2 


为 了 得 到 一 个 月 的 第 一 天 ， 调 用 DAY 国 数 。 有 了 DAY 函数 ， 就 能 方便 地 知道 给 定 日 期 是 
当前 月 份 的 第 几 天 。 如 果 用 当前 日 期 减 去 DAY(CURRENT_DATE) 国 数 调用 的 返回 值 ， 我 们 将 
得 到 上 个 月 的 最 后 一 天 ; 在 此 基础 上 加 上 1 天 的 话 ， 就 能 算出 当前 月 份 的 第 一 天 。 为 找 
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出 一 个 月 的 最 后 一 天 ， 要 先 在 当前 日 期 的 基础 上 加 上 1 个 月 。 这 将 得 到 下 个 月 的 同一 天 
(即使 接 下 来 的 一 个 月 天 数 少 于 当前 月 份 ， 该 数学 计算 仍 将 返回 正确 的 结果 )。 然 后 减 去 
DAY(CURRENT_DATE) 函数 调用 的 返回 值 ， 就 得 到 了 当前 月 份 的 最 后 一 天 。 


Oracle 
为 了 得 到 当前 月 份 的 第 一 天 ， 调 用 TRUC 函数 ， 并 把 m 作为 第 二 个 参数 ， 这 样 就 能 “ 堆 
断 ” 当 前 日 期 得 到 当前 月 份 的 第 一 天 。 为 获取 当前 月 份 的 最 后 一 天 ， 只 需 调用 LAST. DAY ERI 
数 即 可 。 


PostgreSQL 

为 得 到 当前 月 份 的 第 一 天 ， 调 用 DATE_TRUNC 函数 ， 并 把 month 作为 第 二 个 参数 ， 这 样 就 能 
“截断 ”当前 日 期 得 到 当前 月 份 的 第 一 天 。 为 获取 当前 月 份 的 最 后 一 天 ， 在 当前 月 份 第 一 
天 的 基础 上 加 上 1 个 月 ， 然 后 再 减 去 1 天 即 可 。 

MySQL 

为 了 得 到 当前 月 份 的 第 一 天 ， 调 用 DAY 函数 。 有 了 DAY 函数 ， 就 能 方便 地 知道 给 定 日 期 是 
当前 月 份 的 第 几 天 。 如 果 用 当前 日 期 减 去 DAY(CURRENT_DATE) 函数 调用 的 返回 值 ， 我 们 将 
得 到 上 个 月 的 最 后 一 天 ;在 此 基础 上 加 上 1 天 的 话 ， 就 能 算出 当前 月 份 的 第 一 天 。 为 获取 
当前 月 份 的 最 后 一 天 ， 只 要 调用 LAST. DAY 国 数 即 可 。 


SQL Server 

为 了 得 到 一 个 月 的 第 一 天 ， 调 用 DAY 函数 。 有 了 DAY 函数 ， 就 能 方便 地 知道 给 定 日 期 是 当 
前 月 份 的 第 几 天 。 如 果 用 当前 日 期 减 去 DAY(GETDATE( )) 函数 调用 的 返回 值 ， 我 们 将 得 到 上 
个 月 的 最 后 一 天 ;在 此 基础 上 加 上 1 天 的 话 ， 就 能 计算 出 当前 月 份 的 第 一 天 。 为 了 获取 当 
前 月 份 的 最 后 一 天 ， 需 要 调用 DATEADD 函数 。 在 当前 日 期 的 基础 上 加 上 1 个 月 ， 然 后 减 去 
调用 DAY(GETDATE( )) 函数 的 返回 值 ， 这 样 就 得 到 了 当前 月 份 的 最 后 一 天 。 


9.5 列 出 一 年 中 所 有 的 星期 五 


1. 问题 
对 于 一 周 的 某 一 天 ， 你 想 找 出 一 年 中 与 之 对 应 的 所 有 日 期 。 例 如 ， 你 希望 生成 一 个 列表 ， 
列 出 当前 年 份 所 有 的 星期 五 。 


2. 解决 方案 

不 论 使 用 哪 一 种 数据 库 ， 解 决 本 问题 的 关键 都 在 于 先 列 出 当前 年 份 的 每 一 天 ， 然 后 往 选 出 
符合 条 件 的 日 期 。 下 面 的 解决 方案 以 找 出 所 有 的 星期 五 为 例 。 

DB2 

使 用 WITH 递归 查询 列 出 当前 年 份 的 每 一 天 ， 然 后 调用 DAYNAME 函数 筛选 出 星期 五 对 应 的 
日 期 。 








































































































1 with x (dy,yr) 

2 as ( 

3 select dy, year(dy) yr 
4 from ( 

5 select (current date - 
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6 dayofyear(current_date) days +1 days) as dy 
7 from t1 

8 ) tmp1 

9 union all 

10 select dy+1 days, yr 

11 from x 

12 where year(dy +1 day) = yr 

13 ) 

14 select dy 

15 from x 


16 where dayname(dy) = 'Friday' 


Oracle 
使 用 CONNECT BY 递归 查询 列 出 当前 年 份 的 每 一 天 ， 然 后 调用 TO_CHAR ER Sc üu rH Æ At 
应 的 日 期 。 





1 with x 

2 as ( 

3 select trunc(sysdate,'y')+level-1 dy 
4 from t1 

5 connect by level <= 
6 add_months(trunc(sysdate,'y'),12)-trunc(sysdate,'y') 
7 ) 

8 select * 

9 from x 

10 where to char( dy, 'dy') = 'fri' 


PostgreSQL 
使 用 GENERATE, SERIES 函数 列 出 当前 年 份 的 每 一 天 ， 然 后 调用 TO, CHAR. 函数 筛选 出 星期 五 
对 应 的 日 期 。 








1 select cast(date trunc('year',current date) as date) 
2 * x.id as dy 
3 from generate series ( 
4 0, 
5 ( select cast( 
6 cast( 
7 date trunc('year',current date) as date) 
8 * interval '1 years' as date) 
9 - cast( 
10 date trunc('year',current date) as date) )-1 
11 ) x(id) 
12 where to char( 
13 cast( 
14 date trunc('year',current date) 
15 as date)sx.id,'dy') = 'fri' 
MySQL 





使 用 数据 透视 表 T5099 列 出 当前 年 份 的 每 一 天 ， 然 后 调用 DAYNAME PAZ riu rH J RJ o6] BJ 
日 期 。 


1 select dy 
2 from ( 
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3 select adddate(x.dy,interval t500.id-1 day) dy 
4 from ( 

5 select dy, year(dy) yr 

6 from ( 

7 select adddate( 

8 adddate(current date, 


9 interval -dayofyear(current date) day), 
10 interval 1 day ) dy 

11 from t1 

12 ) tmp1 

13 ) x, 

14 t500 

15 where year(adddate(x.dy,interval t500.id-1 day)) = x.yr 
16 ) tmp2 


17 where dayname(dy) = 'Friday' 


SQL Server 
使 用 WITH 递归 查询 列 出 当前 年 份 的 每 一 天 ， 然 后 调用 DAYNAME ERU Zt fi b rH E BH TOME PR 
日 期 ° 





1 with x (dy,yr) 

2 as ( 

3 select dy, year(dy) yr 

4 from ( 

5 select getdate()-datepart(dy,getdate())+1 dy 
6 from t1 

7 ) tmp1 

8 union all 

9 select dateadd(dd,1,dy), yr 

10 from x 

11 where year(dateadd(dd,1,dy)) = yr 
12 ) 

13 select x.dy 

14 from x 


15 where datename(dw,x.dy) = 'Friday' 
16 option (maxrecursion 400) 


DB2 

为 了 找 出 当前 年 份 所 有 的 星期 五 ， 我 们 必须 先 列 出 来 当前 年 份 的 每 一 天 。 第 一 步 要 调用 

DAYOFYEAR 图 数 找到 当前 年 份 的 第 一 天 。 从 当前 日 期 里 减 去 DAYOFYEAR(CURRENT_DATE) 国 数 

调用 的 返回 值 可 以 得 到 上 一 年 12 月 31 日 ， 再 加 上 1 天 就 得 到 了 当前 年 份 的 第 一 天 。 
select (current date - 


dayofyear(current date) days +1 days) as dy 
from t1 























01-JAN-2005 


现在 我 们 知道 了 当前 年 份 的 第 一 天 ， 接 着 使 用 WITH 子 名 在 当前 年 份 第 一 天 的 基础 上 逐次 
加 上 1 天 ， 直 至 得 到 的 日 期 不 再 属于 当前 年 份 。 上 述 得 到 的 结果 集 将 是 当前 年 份 的 每 一 天 






































日 期 处 理 | 211 








(递归 视图 X 查询 的 部 分 结果 如 下 所 示 )。 


with x (dy,yr) 
as ( 
select dy, year(dy) yr 
from ( 
select (current_date - 
dayofyear(current_date) days +1 days) as dy 
from t1 
) tmp1 
union all 
select dy+1 days, yr 
from x 
where year(dy +1 day) = yr 


select dy 
from x 
01-JAN-2005 
15-FEB-2005 
22-NOV-2005 
31-DEC-2005 
最 后 ， 调 用 DAYNAME 函数 筛选 出 星期 五 对 应 的 日 期 。 


Oracle 
为 了 找到 当前 年 份 所 有 的 星期 五 ， 我 们 必须 先 列 出 来 当前 年 份 的 每 一 天 。 首 先 调用 TRUNC 
函数 得 到 当前 年 份 的 第 一 天 。 
select trunc(sysdate,'y') dy 
from t1 








01-JAN-2005 


然后 ， 使 用 CONNECT BY 子 句 返回 当前 年 份 的 每 一 天 (参见 第 13 章 中 的 相关 内 容 ， 以 了 解 
如 何 使 用 CONNECT BY 生成 行 数据 )。 





oa 
^C] 





顺便 说 一 下 ， 虽 然 本 实例 采用 了 基于 WITH 子 句 的 解决 方案 ， 但 其 实 也 可 以 使 
。 用 内 嵌 视 图 达到 同样 目的 。 

















在 写作 本 书 时 ，Oracle 的 WITH 子 句 并 不 用 于 实现 递归 操作 (这 不 同 于 DB2 和 SQL Server), 
递归 操作 是 由 CONNECT BY 完成 的 。 视 图 x 返回 的 部 分 结果 集 如 下 所 示 。 
with x 


as ( 
select trunc(sysdate, 'y')«level-1 dy 























from t1 
connect by level <= 
add_months(trunc(sysdate,'y'),12)-trunc(sysdate,'y') 


01-JAN-2005 
15-FEB-2005 
22-NOV-2005 
31-DEC-2005 
最 后 ， 调 用 TO. CHAR 函数 筛选 出 星期 五 对 应 的 日 期 。 


PostgreSQL 

为 了 找 出 当前 年 份 所 有 的 星期 五 ， 我 们 必须 先 把 当前 年 份 的 每 一 天 都 当 作 一 条 记录 返回 。 
这 里 需要 使 用 GENERATE SERIES 函数 。GENERATE_SERIES 国 数 返 回 的 起 点 和 终点 值 分 别 是 0 
和 当前 年 份 总 天 数 减 1。 传递 给 GENERATE_SERIES 函数 的 第 一 个 参数 是 0， 第 二 个 参数 则 是 
一 个 查询 ， 该 查询 用 于 计算 出 当前 年 份 有 多 少 天 。( 因 为 我 们 要 在 当前 年 份 第 一 天 的 基础 
上 逐日 累加 ， 实 际 上 要 累加 的 天 数 恰好 比 当前 年 份 的 总 天 数 少 1 天 ， 这 样 才 不 至 于 溢出 到 
下 一 年 。) GENERATE SERIES 函数 的 第 二 个 参数 返回 的 结果 如 下 所 示 。 


select cast( 
cast( 
date trunc('year',current date) as date) 
* interval '1 years' as date) 


















































- cast( 
date trunc('year',current date) as date)-1 as cnt 
from t1 
CNT 
364 


请 记 住 ， 根 据 上 述 结 果 集 ，FROM 子 句 里 的 GENERATE. SERIES 函数 调用 看 起 来 是 这 样 的 : 
GENERATE_SERIES(0,364)。 如 果 是 闲 年 ， 例 如 2004 年 ， 第 二 个 参数 则 是 365, 


为 了 生成 当前 年 份 全 部 日 期 的 列表 ， 下 一 步 就 要 把 GENERATE SERIES 函数 的 返回 值 依次 加 
上 当前 年 份 的 第 一 天 。 部 分 结果 如 下 所 示 。 


select cast(date trunc('year',current date) as date) 
+ X.id as dy 
from generate series ( 
0, 

( select cast( 

cast( 
date_trunc('year',current_date) as date) 
+ interval '1 years' as date) 
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- cast( 
date_trunc('year',current_date) as date) )-1 








) x(id) 

DY 

01-3AN-2005 

15-FEB-2005 

22-NOV-2005 

31-DEC-2005 
最 后 ， 调 用 TO CHAR 国 数 筛选 出 星期 五 对 应 的 日 期 。 
MySQL 


为 了 找 出 当前 年 份 的 全 部 星期 五 ， 我 们 先 列 出 来 当前 年 份 的 每 一 天 。 首 先 要 调用 
DAYOFYEAR 国 数 找 出 当前 年 份 的 第 一 天 。 从 当前 日 期 里 减 去 DAYOFYEAR(CURRENT_DATE) 国 数 
调用 的 返回 值 ， 然 后 再 加 上 1 天 ， 这 样 就 得 到 了 当前 年 份 的 第 一 天 。 
select adddate( 
adddate(current_date, 


interval -dayofyear(current date) day), 
interval 1 day ) dy 














from t1 


01-JAN-2005 


然后 ， 使 用 T500 表 生 成 足够 多 的 行 以 返回 当前 年 份 的 每 一 天 。 我 们 要 在 当前 年 份 第 一 天 的 
基础 上 逐一 加 上 T500.1D 的 值 ， 直 至 当前 年 份 结束 。 这 个 操作 的 部 分 结果 如 下 。 


select adddate(x.dy,interval t500.id-1 day) dy 
from ( 
select dy, year(dy) yr 
from ( 
select adddate( 
adddate(current date, 
interval -dayofyear(current date) day), 
interval 1 day ) dy 























from t1 
) tmp1 
) x, 
t500 
where year(adddate(x.dy,interval t500.id-1 day)) = x.yr 





22-N0V-2005 


31-DEC-2005 





最 后 ， 调 用 DAYNAME 2 ii H B RJ wF) BJ H BJ, 
SQL Server 





为 了 找 出 当前 年 份 所 有 的 星期 五 ， 我 们 必须 先 列 出 当前 年 份 的 每 一 天 。 首 先 要 调用 
DATEPART 函数 得 到 当前 年 份 的 第 一 天 。 从 当前 日 期 里 减 去 DATEPART(DY,GETDATE()) 函数 调 
用 的 返回 值 ， 并 加 上 1 天 ， 就 得 到 了 当前 年 份 的 第 一 天 。 


select getdate()-datepart(dy,getdate())+1 dy 
from t1 























01-JAN-2005 


现在 知道 了 当前 年 份 的 第 一 天 ， 接 着 使 用 WITH 子 句 和 DATEADD 函数 在 第 一 天 的 基础 上 未 
次 加 上 1 天， 直至 当前 年 份 的 最 后 一 天 。 这 样 一 来 ， 得 到 的 结果 集 就 是 当前 年 份 的 每 一 天 
(递归 视图 X 返 回 的 部 分 行 如 下 所 示 )。 


with x (dy,yr) 
as ( 
select dy, year(dy) yr 
from ( 
select getdate()-datepart(dy,getdate())+1 dy 
from t1 
) tmp1 
union all 
select dateadd(dd,1,dy), yr 
from x 
where year(dateadd(dd,1,dy)) = yr 
) 
select x.dy 
from x 
option (maxrecursion 400) 
































01-JAN-2005 
15-FEB-2005 
22-NOV-2005 
31-DEC-2005 


最 后 ， 调 用 DATENAME ERIS iB rH A HEROS PZHJ HH. AFERRA Sende. RME 
MAXRECURSION 的 值 ， 使 之 不 小 于 366 (这 是 为 了 过 滤 递 归 视 图 Xx， 使 得 查询 结果 都 是 当前 
年 份 的 数据 ， 并 保证 结果 集 不 超过 366 行 )。 
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96 找 出 当前 月 份 的 第 一 个 和 最 后 一 个 星期 一 





1. 问题 
例如 ， 你 希望 找 出 当前 月 份 的 第 一 个 和 最 后 一 个 星期 一 。 
2. 解决 方案 


在 这 里 我 们 选择 当前 月 份 和 星期 一 。 事 实 上 ， 下 面 给 出 的 解决 方案 适用 于 任何 一 个 月 份 和 
一 周 七 天 里 的 任何 一 天 。 一 周 有 七 天 ， 一 且 我 们 知道 了 第 1 个 星期 一 对 应 的 日 期 ， 那 么 加 
上 7 天 就 能 得 到 第 2 个 星期 一 ， 加 上 14 天 就 能 得 到 第 3 个 星期 一 。 类 似 地 ， 如 果 我 们 知 
道 当 前 月 份 最 后 一 个 星期 一 对 应 的 日 期 ， 那 么 减 去 7 天 就 能 得 到 第 3 个 星期 一 ， 减 去 14 
天 就 能 得 到 第 2 个 星期 一 。 

DB2 

使 用 WITH 递归 查询 生成 当前 月 份 的 每 一 天 ， 并 使 用 CASE 表达 式 标记 所 有 的 星期 一 。 第 一 
个 和 最 后 一 个 星期 一 分 别 是 最 早 的 和 最 晚 的 、 带 有 标记 的 日 期 。 











T 











1 with x (dy,mth,is monday) 

2 as ( 

3 select dy,month(dy), 

4 case when dayname(dy)-'Monday' 

5 then 1 else 0 

6 end 

7 from ( 

8 select (current date-day(current date) day +1 day) dy 
9 from t1 


11 union all 
12 select (dy +1 day), mth, 


13 case when dayname(dy +1 day)-'Monday' 

14 then 1 else 0 

15 end 

16 from x 

17 where month(dy +1 day) = mth 

18 ) 

19 select min(dy) first monday, max(dy) last monday 
20 from x 


21 where is monday - 1 


Oracle 
使 用 NEXT. DAY 和 LAST. DAY 函数 ， 辅 以 少许 日 期 计算 的 技巧 ， 以 找 出 当前 月 份 的 第 一 个 和 
最 后 一 个 星期 一 。 

select next_day(trunc(sysdate,'mm')-1,'MONDAY') first_monday, 


next_day(last_day(trunc(sysdate,'mm'))-7,'MONDAY') last_monday 
from dual 





PostgreSQL 

使 用 DATE_TRUNC 函数 找 出 当前 月 份 的 第 一 天 。 有 了 当前 月 份 第 一 天 的 日 期 ， 就 能 通过 简单 
的 数学 运算 〈 星 期 日 到 星期 六 分 别 对 应 数值 1 和 7) 得 到 当前 月 份 的 第 一 个 和 最 后 一 个 星 
期 一 。 





























1 select first_monday, 
2 case to_char(first monday+28,'mm') 
3 when mth then first_monday+28 
4 else first monday421 
5 end as last monday 
6 from ( 
7 select case sign(cast(to char(dy,'d') as integer)-2) 
8 when 0 
9 then dy 
10 when -1 
11 then dy«abs(cast(to char(dy,'d') as integer)-2) 
12 when 1 
13 then (7-(cast(to char(dy,'d') as integer)-2))«dy 
14 end as first monday, 
15 mth 
16 from ( 
17 select cast(date trunc('month',current date) as date) as dy, 
18 to char(current date,'mm') as mth 
19 from t1 
20 ) x 
21 ) y 
MySQL 
使 用 ADDDATE 函数 找 出 当前 月 份 的 第 一 天 。 有 了 当前 月 份 第 一 天 的 日 期 ， 就 能 通过 简单 
的 数学 运算 〈 星 期 日 到 星期 六 分 别 对 应 数值 1 和 7) 得 到 当前 月 份 的 第 一 个 和 最 后 一 个 
星期 一 。 
1 select first_monday, 
2 case month(adddate(first_monday,28)) 
3 when mth then adddate(first_monday,28) 
4 else adddate(first_monday,21) 
5 end last_monday 
6 from ( 
7 select case sign(dayofweek(dy)-2) 
8 when 0 then dy 
9 when -1 then adddate(dy,abs(dayofweek(dy)-2)) 
10 when 1 then adddate(dy,(7-(dayofweek(dy)-2))) 
11 end first_monday, 
12 mth 
13 from ( 
14 select adddate(adddate(current_date,-day(current_date)),1) dy, 
15 month(current_date) mth 
16 from t1 
17 ) x 
18 ) y 
SQL Server 
使 用 WITH 递归 查询 生成 当前 月 份 的 每 一 天 ， 并 使 用 CASE 表达 式 标记 所 有 的 星期 一 。 第 一 
个 和 最 后 一 个 星期 一 分 别 是 最 早 的 和 最 晚 的 、 带 有 标记 的 日 期 。 
1 with x (dy,mth,is monday) 
2 as ( 
3 select dy,mth, 
4 case when datepart(dw,dy) - 
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5 then 1 else 0 

6 end 

7 from ( 

8 select dateadd(day,1,dateadd(day,-day(getdate()),getdate())) dy, 
9 month(getdate()) mth 

10 from t1 

11 ) tmp1 


12 union all 
13 select dateadd(day,1,dy), 


14 mth, 
15 case when datepart(dw,dateadd(day,1,dy)) = 2 
16 then 1 else 0 
17 end 
18 from x 
19 where month(dateadd(day,1,dy)) = mth 
20 ) 
21 select min(dy) first monday, 
22 max(dy) last monday 
23 from x 
24 where is monday - 1 
3. 讨论 
DB2 和 SQL Server 








DB2 和 SQL Server 的 解决 方案 使 用 了 不 同 的 国 数 ， 但 其 做 法 并 无 二 致 。 如 果 我 们 仔细 审视 
这 两 个 解决 方案 的 话 ， 就 会 发 现 它们 的 唯一 差别 在 于 日 期 的 加 法 运算 。 下 面 的 讨论 将 涵盖 
这 两 种 数据 库 ， 但 是 会 借用 DB2 解决 方案 的 代码 来 演示 中 间 步 又 的 结果 。 


oa 


























如 果 你 没有 办 法 找到 支持 WITH 递归 查询 语法 的 SQL Server 或 DB2 版 本 ， 不 
Š d. RH PostgreSQL 解决 方案 的 做 法 。 

eu 
为 了 找 出 当前 月 份 的 第 一 个 和 最 后 一 个 星期 一 ， 第 一 步 是 找到 当前 月 份 的 第 一 天 。 递 归 
视图 x 里 的 内 嵌 视 图 TP 可 以 找 出 当前 月 份 的 第 一 天 ， 它 的 做 法 是 先 找 出 当前 日 期 ， 并 
且 要 特别 地 计算 出 该 日 期 是 当前 月 份 的 第 几 天 。 计 算出 当前 日 期 是 当前 月 份 的 第 几 天 ， 
就 知道 到 该 日 期 为 止 这 个 月 已 经 过 去 了 多 少 天 (例如 ,4 月 10 日 是 4 月 份 的 第 10 X). 
从 当前 日 期 里 减 去 该 值 ， 就 退回 到 了 上 个 月 的 最 后 一 天 〈 例 如 ，4 月 10 日 减 去 10 天， 
结果 就 是 3 月 份 的 最 后 一 天 )。 做 过 上 述 减法 运算 之 后 ， 只 要 再 加 上 1 天 就 能 得 到 当前 月 
份 的 第 一 天 了 。 


select (current date-day(current date) day +1 day) dy 
from t1 





























01-JUN-2005 
下 一 步 要 找 出 当前 日 期 对 应 的 月 份 ， 调 用 MONTH 函数 ， 并 使 用 简单 的 CASE 表达 式 来 确认 这 
个 月 的 第 一 天 是 不 是 星期 一 。 


select dy, month(dy) mth, 
case when dayname(dy)='Monday' 





A 
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then 1 else 0 
end is monday 
from ( 
select (current date-day(current date) day +1 day) dy 
from t1 
) tmp1 


DY MTH IS MONDAY 


01-JUN-2005 6 0 


接着 ， 借 助 WITH 子 句 的 递归 特性 在 当前 月 份 第 一 天 的 基础 上 不 断 地 加 上 1 天 ， 直 到 当前 月 
份 最 后 一 天 。 同 时 ， 也 可 以 使 用 CASE 表达 式 来 确认 每 一 个 日 期 是 不 是 星期 一 (星期 一 将 被 
标记 为 “1”)。 弟 归 视 图 x 的 部 分 查询 结果 如 下 所 示 。 


with x (dy,mth,is, monday) 
as ( 
select dy,month(dy) mth, 
case when dayname(dy)- ' Monday' 
then 1 else 0 
end is, monday 
from ( 
select (current date-day(current date) day +1 day) dy 
from t1 
) tmp1 
union all 
select (dy +1 day), mth, 
case when dayname(dy +1 day)-'Monday' 
then 1 else 0 






































end 
from x 
where month(dy +1 day) = mth 
) 
select * 
from x 


DY MTH IS MONDAY 
01-JUN-2005 
02- JUN-2005 
03- JUN-2005 
04- JUN-2005 
05- JUN-2005 
06- JUN-2005 
07- JUN-2005 
08- JUN-2005 


ON OA OA OA O O: O: OX 
@ @ = @ @ @ @ Oo 


只 有 星期 一 对 应 的 IS_MONDAY 是 1， 因 而 最 后 一 步 是 针对 IS_MONDAY 等 于 1 的 行 调用 聚合 
数 MIN 和 MAX， 以 找 出 当前 月 份 的 第 一 个 和 最 后 一 个 星期 一 。 


Oracle 
有 了 NEXT_DAY ERE, ee ua 了 。 为 了 找 出 当前 月 份 的 第 一 个 星期 一 ， 先 
到 前 一 个 月 的 最 后 一 天 ， 这 需要 借助 一 些 日 期 计算 ,包括 TRUNC 函数 。 

















—— 
au 
dac 
ANS 
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select trunc(sysdate,'mm')-1 dy 
from dual 


31-MAY-2005 
然后 ， 调 用 NEXT. DAY 函数 计算 出 紧 随 前 个 月 最 后 一 天 出 现 的 第 一 个 星期 一 (也 就 是 当前 月 
份 的 第 一 个 星期 一 )。 


select next_day(trunc(sysdate,'mm')-1,'MONDAY') first monday 
from dual 


FIRST MONDAY 


06-JUN-2005 
为 了 找 出 当前 月 份 的 最 后 一 个 星期 一 ， 先 要 调用 TRUNC 函数 计算 出 当前 月 份 第 一 天 。 


select trunc(sysdate,'mm') dy 
from dual 


01-JUN-2005 
下 一 步 是 找 出 这 个 月 的 最 后 一 周 (最 后 7 天 )， 调 用 LAST. AY 函数 找到 这 个 月 的 最 后 一 天 ， 
然后 减 去 7 天 。 


select last_day(trunc(sysdate,'mm'))-7 dy 
from dual 





23-JUN-2005 
我 们 之 所 以 要 从 当前 月 份 的 最 后 一 天 向 前 倒退 7 天， 是 为 了 保证 这 7 天 里 至 少 剩 下 一 个 星 
期 一 。 最 后 ， 调 用 NEXT DAY 函数 找到 下 一 个 (当前 月 份 最 后 一 个 ) 星期 一 。 


select next_day(last_day(trunc(sysdate,'mm'))-7,'MONDAY') last monday 
from dual 














LAST MONDAY 


27 - JUN-2005 


PostgreSQL 和 MySQL 

PostgreSQL 和 MySQL 解决 方案 的 思路 也 很 类 似 ， 差 别 在 于 用 到 的 内 置 函 数 不 同 。 虽 然 代 
码 有 点 长 ， 这 两 个 解决 方案 的 查询 语句 其 实 非常 简单 。 而 且 ， 在 计算 当前 月 份 第 一 个 和 最 
后 一 个 星期 一 的 过 程 中 ， 并 未 增加 多 少 额外 的 复杂 度 。 


首先 找 出 当前 月 份 的 第 一 天 ， 紧 接着 要 找 出 当前 月 份 的 第 一 个 星期 一 。 由 于 没有 内 置 函数 
可 以 找到 下 一 个 星期 一 ， 需 要 做 一 些 日 期 运算 。( 这 两 个 解决 方案 中 任何 一 个 的 ) 第 7 行 
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开始 的 CASE 表达 式 评估 当前 月 份 的 第 一 天 是 不 是 星期 一 。(PostgresSQL 的 ) TO. CHAR 函数 
在 指定 了 pD 或 者 d 格 式 的 情况 下 会 返回 1 到 7， 分 别 表示 星期 日 到 星期 六 ，(MySQL 的 ) 
DAYOFWEEK 函数 亦 然 。 其 中 ， 星 期 一 对 应 的 值 始 终 是 2。 CASE 表达 式 要 评估 的 对 象 是 SIGN 
函数 的 返回 值 ， 当 前 月 份 的 第 一 天 对 应 的 数值 (不论 它 是 星期 几 ) 减 去 星期 一 对 应 的 数值 
2， 该 减法 运算 的 结果 传递 给 SIGN 函数 。 如 果 结 果 是 0， 那 么 当前 月 份 的 第 一 天 就 是 星期 
一 ， 并 且 也 是 当前 月 份 的 第 一 个 星期 一 。 如 果 结 果 是 -1， 那 么 当前 月 份 的 第 一 天 就 是 星期 
日 ， 只 要 在 当前 月 份 的 第 一 天 的 基础 上 再 加 上 2 和 1 (分 别 代 表 星 期 一 和 星期 日 ) 之 间 相 
差 的 天 数 就 能 得 到 当前 月 份 的 第 一 个 星期 一 了 。 



























































如 果 觉 得 理解 起 来 有 点 困难 ， 不 妨 暂 时 抛 开 某 天 是 星期 几 这 种 想法 ， 只 关注 
数字 和 运算。 例如， 如 果 今 天 是 星期 二 ， 而 我 们 想 知 道 下 一 个 星期 五 的 日 期 。 
”可 以 调用 指定 了 dd 格式 参数 的 TO_CHAR 函数 ， 也 可 以 调用 DAYOFWEEK 函数 ， 
星期 五 对 应 数字 6， 星期 二 则 对 应 3。 从 3 数 到 6， 直 接 做 减法 即 可 (6-3 = 3)， 
然后 加 上 两 者 之 中 较 小 的 那个 数字 〈(6-3) + 3 = 6)。 因 此 ， 先 别管 具体 的 日 
期 是 什么 ， 如 果 起 始 日 期 对 应 的 数值 小 于 目标 日 期 ， 那 么 在 起 始 日 期 的 基础 
上 加 上 两 个 日 期 的 差 值 就 能 得 到 目标 日 期 对 应 的 日 期 了 。 


= 


















































如 果 结 果 是 1， 那 么 当前 月 份 的 第 一 天 就 介 于 星期 二 和 星期 六 之 间 (包含 起 止 日 期 )。 如 果 
当前 月 份 第 一 天 对 应 的 数值 大 于 2 (星期 一 )， 先 算出 当前 月 份 第 一 天 和 星期 一 对 应 的 数字 
(2) 之 间 的 差 值 ， 用 7 减 去 该 差 值 ， 再 将 上 述 计算 结果 加 到 当前 月 份 的 第 一 天 上 。 这 样 ， 
就 得 到 了 当前 月 份 第 一 个 星期 一 。 


oa 


这 再 次 提醒 ， 如 果 你 觉得 理解 起 来 有 点 困难 ， 不 妨 暂时 抛 开 某 天 是 星期 儿 这 种 
“<. 
2 

' 


















































。 想 法 ， 只 关注 数字 运算 。 例 如， 假定 现在 是 星期 五 ， 我 们 想 找 出 下 个 星期 二 

对 应 的 日 期 。 星 期 二 〈 对 应 数字 3) 比 星期 五 (对 应 数字 6) 小 。 从 6 数 到 
3， 先 计算 出 两 个 数字 之 间 差 值 ， 并 用 7 减 去 该 差 值 (7-(|3-6|) = 4) ， 然 后 在 
起 始 日 星期 五 的 基础 上 加 上 这 个 结果 (4)。(“|3-6|” 里 的 竖 线 表示 生成 差 值 
对 应 的 绝对 值 。) 这 里 不 能 在 6 的 基础 上 再 加 上 4 (这 将 得 到 10)， 我 们 需要 
在 星期 五 的 基础 上 加 上 4 天， 这 样 才能 得 到 下 一 个 星期 二 。 























EË CASE 表达 式 的 思路 是 ， 为 PostgreSQL 和 MySQL 实现 类 似 Oracle 的 NEXT. DAY 函数 的 

功能 。 如 果 我 们 不 以 当前 月 份 的 第 一 天 为 起 点 ，DY 的 值 就 变 成 了 CURRENT. DATE 函数 的 返回 

值 ， 而 CASE 表达 式 的 计算 结果 也 就 变 成 了 从 当前 日 期 开始 算 起 的 下 一 个 星期 一 〈 如 果 当 前 

日 期 是 星期 一 ， 那 么 返回 值 会 是 其 自身 )。 

现在 知道 了 当前 月 份 的 第 一 个 星期 一 ， 加 上 21 天 或 者 28 天 就 能 得 到 当前 月 份 的 最 后 一 个 

星期 一 。 第 2 行 到 第 5 行 之 间 的 CASE 表达 式 决 定 应 该 加 上 21 天 还 是 28 天 ， 这 要 视 加 上 

28 天 之 后 会 不 会 落 入 下 个 月 而 定 。 该 CASE 表达 式 通 过 下 述 步 又 实现 该 计算 。 

(1) ZJ FIRST_MONDAY 加 上 28 R. 

(2) 调用 PostgreSQL 的 TO CHAR 函数 或 者 MySQL 的 MONTH 函数 ，CASE 表达 式 从 上 述 FIRST_ 
MONDAY + 28 的 计算 结果 里 得 到 与 之 对 应 的 月 份 
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(3) 第 2 PRR A A BARAER [B| BJ MTH 值 相 比 较 。MTH 的 值 是 CURRENT. DATE 对 应 的 
月 份 。 如 果 两 个 月 份 相 同 ， 那 么 这 个 月 就 大 到 需要 再 加 上 28 天 ， 因 而 CASE 表达 式 会 
返回 FIRST_MONDAY + 28。 如 果 两 个 月 份 不 同 ， 那 么 加 上 28 天 就 会 超出 当前 月 份 的 范围 ， 
因而 CASE 表达 式 会 返回 FIRST_MONDAY + 21。 显 而 易 见 ， 要 么 加 上 28 天 ， 要 么 加 上 21 
天 ， 我 们 只 需要 考虑 这 两 种 状况 。 












































我 们 甚至 可 以 扩展 本 解决 方案 ， 分 别 加 上 7 天 和 14 天 就 能 得 到 当前 月 份 的 
GS 4 第 2 个 和 第 3 个 星期 一 。 
es 


9.7 生成 日 历 


1. 问题 

你 想 为 当前 月 份 生 成 一 个 日 历 。 日 历 的 格式 应 该 像 我 们 桌面 上 摆 放 的 台历 那样 横向 有 7 
列 ，( 通 常 ) 纵向 有 5 fr. 

2. 解决 方案 

下 述 每 种 解决 方案 都 略 有 不 同 之 处 ， 但 它们 解决 问题 的 思路 是 相同 的 。 列 出 当前 月 份 的 每 
一 天 ， 然 后 根据 每 一 天 是 星期 几 确 定 输出 顺序 以 生成 日 历 。 

日 历 有 许多 种 不 同 的 格式 。 例 如 ，Unix 下 的 cal 命令 输出 的 格式 是 从 星期 日 到 星期 六 。 本 
实例 基于 ISO 标准 ， 按 照 星 期 一 到 星期 五 的 顺序 生成 日 历 。 掌 握 了 本 实例 提供 的 解决 方案 
之 后 ， 就 能 根据 自己 的 喜好 轻松 地 重新 安排 日 历 的 格式 了 。 











E a 
` 





如 果 我 们 试图 使 用 SQL 完成 各 种 格式 化 操作 以 便 让 输出 结果 更 具 可 读 性 的 
。 话 ， 那 么 查询 语句 也 会 变 得 更 长 。 不 要 被 这 些 长 长 的 查询 吓 住 ， 如 果 把 本 实 
二 ， 例 里 的 各 种 查询 分 解 开 ， 并 一 段 一 段 地 执行 的 话 ， 我 们 就 会 发 现 它们 实际 上 
已 经 足够 简洁 了 。 

















DB2 
(EM WITH 递归 查询 列 出 当前 月 份 的 每 一 天 ， 然 后 使 用 CASE 表达 式 和 MAX 函数 根据 每 一 天 
是 星期 几 编排 输出 顺序 。 


1 with x(dy,dm,mth,dw,wk) 

2 as ( 

3 select (current_date -day(current_date) day +1 day) dy, 

4 day((current_date -day(current_date) day +1 day)) dnm, 
5 month(current_date) mth, 
6 

7 

8 





dayofweek(current_date -day(current_date) day +1 day) dw， 
week iso(current date -day(current date) day +1 day) wk 
from t1 
9 union all 
10 select dy+1 day, day(dy«1 day), mth, 


11 dayofweek(dy-1 day), week iso(dy«1 day) 
12 from x 

13 where month(dy«1 day) = mth 

14 ) 





A 
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15 
16 
17 
18 
19 
20 
21 
22 
23 
24 


Oracle 


select max(case dw when 2 then dm end) as Mo, 
max(case dw when 3 then dm end) as Tu, 
max(case dw when 4 then dm end) as We, 
max(case dw when 5 then dm end) as Th, 
max(case dw when 6 then dm end) as Fr, 
max(case dw when 7 then dm end) as Sa, 
max(case dw when 1 then dm end) as Su 

from x 
group by wk 
order by wk 


使 用 CONNECT BY 递归 查询 列 出 当前 月 份 的 每 一 天 ， 然 后 使 用 CASE 表达 式 和 MAX 函数 根据 每 
一 天 是 星期 几 编 排 输 出 顺序 。 








1 with x 
2 as ( 
3 select * 
4 from ( 
5 select to_char(trunc(sysdate,'mm')+level-1,'iw') wk, 
6 to char(trunc(sysdate, 'mm')«level-1,'dd') dm, 
7 to number(to char(trunc(sysdate, 'mm')4level-1,'d')) dw, 
8 to char(trunc(sysdate, 'mm')«level-1,'mm') curr mth, 
9 to char(sysdate,'mm') mth 
10 from dual 
11 connect by level «- 31 
12 ) 
13 where curr mth = mth 
14 ) 
15 select max(case dw when 2 then dm end) Mo, 
16 max(case dw when 3 then dm end) Tu, 
17 max(case dw when 4 then dm end) Me, 
18 max(case dw when 5 then dm end) Th, 
19 max(case dw when 6 then dm end) Fr, 
20 max(case dw when 7 then dm end) Sa, 
21 max(case dw when 1 then dm end) Su 
22 from x 
23 group by wk 
24 order by wk 
PostgreSQL 


使 用 GENERATE SERIES 函数 列 出 当前 月 份 的 每 一 天 。 然 后 使 用 CASE 表达 式 和 MAX 函数 根据 
每 一 天 是 星期 几 编 排 输出 顺序 。 


1 
2 
3 
4 
5 
6 
7 
8 
9 


10 








select max(case dw when 2 then dm end) as Mo, 
max(case dw when 3 then dm end) as Tu, 
max(case dw when 4 then dm end) as We, 
max(case dw when 5 then dm end) as Th, 
max(case dw when 6 then dm end) as Fr, 
max(case dw when 7 then dm end) as Sa, 
max(case dw when 1 then dm end) as Su 

from ( 

select * 

from ( 
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11 select cast(date_trunc('month',current_date) as date)+x.id, 


12 to_char( 

13 cast( 

14 date_trunc('month',current_date) 

15 as date)+x.id,'iw') as wk, 
16 to_char( 

17 cast( 

18 date_trunc('month',current_date) 

19 as date)+x.id,'dd') as dm, 
20 cast( 

21 to_char( 

22 cast( 

23 date_trunc('month',current_date) 

24 as date)+x.id,'d') as integer) as dw, 
25 to char( 

26 cast( 

27 date trunc('month',current date) 

28 as date)4sx.id,'mm') as curr mth, 
29 to char(current date,'mm') as mth 
30 from generate series (0,31) x(id) 

31 )x 

32 where mth = curr  mth 

33 )y 


34 group by wk 
35 order by wk 


MySQL 
TE H T500 列 出 当前 月 份 的 每 一 天 ， 然 后 使 用 CASE 表达 式 和 MAX 函数 根据 每 一 天 是 星期 几 
编排 输出 顺序 。 








1 select max(case dw when 2 then dm end) as Mo, 
2 max(case dw when 3 then dm end) as Tu, 
3 max(case dw when 4 then dm end) as We, 
4 max(case dw when 5 then dm end) as Th, 
5 max(case dw when 6 then dm end) as Fr, 
6 max(case dw when 7 then dm end) as Sa, 
7 1 
8 


max(case dw when 1 then dm end) as Su 


from ( 
9 select date format(dy,'9u') wk, 
10 date format(dy,'9Xd') dm, 
11 date format(dy,'9w')«1 dw 
12 from ( 
13 select adddate(x.dy,t500.id-1) dy, 
14 x.mth 
15 from ( 
16 select adddate(current date,-dayofmonth(current date)41) dy, 
17 date format( 
18 adddate(current date, 
19 -dayofmonth(current date)41), 
20 '%m') mth 
21 from t1 
22 )x, 
23 t500 


24 where t500.id «- 31 
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25 and 

26 

27 

28 group 

29 order 
SQL Server 


使 用 WITH 递归 查询 列 出 当前 月 份 的 每 一 天 ， 然 后 使 月 


date_format(adddate(x.dy,t500.id-1),'%m') = x.mth 


) y 
) z 
by wk 


by wk 








是 星期 几 编 排 输出 顺序 。 


with x(dy,dm,mth,dw,wk) 


31 
32 
33 
34 


3. 讨论 
DB2 


首先 要 列 出 当前 月 份 的 每 一 天 。 这 要 用 到 WITH 递归 


as ( 
select 


from 
select 
from 


union 
select 


from 
where 


) 


select 


from 
group 
order 





dy, 
day(dy) dm, 
datepart(m,dy) mth, 
datepart(dw,dy) dw, 
case when datepart(dw,dy) = 1 
then datepart(ww,dy)-1 
else datepart(ww,dy) 
end wk 
( 
dateadd(day, -day(getdate())41,getdate()) dy 
ti 
) x 
all 
dateadd(d,1,dy), day(dateadd(d,1,dy)), mth, 
datepart(dw,dateadd(d,1,dy)), 
case when datepart(dw,dateadd(d,1,dy)) = 1 
then datepart(wk,dateadd(d,1,dy))-1 
else datepart(wk,dateadd(d,1,dy)) 
end 
x 
datepart(m,dateadd(d,1,dy)) = mth 
max(case dw when 2 then dm end) as Mo, 
max(case dw when 3 then dm end) as Tu, 
max(case dw when 4 then dm end) as We, 
max(case dw when 5 then dm end) as Th, 
max(case dw when 6 then dm end) as Fr, 
max(case dw when 7 then dm end) as Sa, 
max(case dw when 1 then dm end) as Su 
x 
by wk 
by wk 





H CASE 表达 式 和 MAX 函数 根据 


每 一 天 


查询 (如果 你 使 用 的 DB2 版 本 不 支持 


WITH， 则 不 妨 借助 类 似 T560 这 样 的 数据 透视 表 ， 有 具体 参考 MySQL 的 解决 方案 )。 除 了 当 
前 月 份 的 每 一 天 (别名 DM)， 我 们 还 要 提取 出 该 日 期 的 不 同 组 成 部 分 ， 它 是 星期 几 (别名 
DW), ， 当 前 的 月 份 〈 别 名 MTH) ， 以 及 符合 ISO 标准 的 周 序号 (别名 WK)。 实 际 的 递归 操作 
发 生 之 前 (UNION ALL 之 前 的 部 分 ) 的 递归 视图 x 的 查询 结果 如 下 所 示 。 
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select (current_date -day(current_date) day +1 day) dy, 
day((current_date -day(current_date) day +1 day)) dn, 
month(current_date) mth, 
dayofweek(current_date -day(current_date) day +1 day) dw, 
week iso(current date -day(current date) day +1 day) wk 
from t1 


01-JUN-2005 01 06 4 22 


接 下 来 就 要 不 断 地 递增 DM 值 (在 当前 月 份 里 向 前 推进 ) ， 直 至 到 达 月 末 。 因 为 我 们 会 遍历 
当前 月 份 中 的 每 一 天 ， 也 就 能 逐一 获得 每 一 天 是 星期 几 ， 以 及 相应 的 符合 ISO 标准 的 周 序 
号 。 部 分 查询 结果 显示 如 下 所 示 。 


with x(dy,dm,mth,dw,wk) 
as ( 
select (current date -day(current date) day +1 day) dy, 
day((current date -day(current date) day +1 day)) dm, 
month(current date) mth, 
dayofweek(current date -day(current date) day +1 day) dw, 
week iso(current date -day(current date) day +1 day) wk 
from t1 
union all 
select dy+1 day, day(dy+1 day), mth, 
dayofweek(dy-1 day), week iso(dy«1 day) 





from x 

where month(dy«1 day) = mth 
) 
select * 

from x 
DY DM MTH DW WK 
01-JUN-2005 01 06 4 22 
02-JUN-2005 02 06 522 
21-JUN-2005 21 06 3 25 
22-JUN-2005 22 06 4 25 
30-JUN-2005 30 06 5 26 

到 目前 为 止 ， 得 到 的 结果 包括 : 当前 月 份 的 每 一 天 ， 两 位 数字 表示 的 日 期 ， 两 位 数字 表示 

















的 月 份 ， 一 位 数字 表示 的 星期 几 (1 ~ 7 分 别 代 表 从 星期 日 到 星期 六 的 每 一 天 )， 以 及 两 位 
数字 表示 的 、 符 合 ISO 标准 的 周 序号 。 有 了 这 些 信息 ， 我 们 就 能 使 用 CASE 表达 式 来 决定 
每 一 个 DM 值 (当前 月 份 的 每 一 天 ) 会 落 到 一 周 的 哪 一 天 。 部 分 查询 结果 如 下 所 示 。 


with x(dy,dm,mth,dw,wk) 
as ( 
select (current date -day(current date) day +1 day) dy, 
day((current date -day(current date) day +1 day)) dm, 
month(current date) mth, 
dayofweek(current date -day(current date) day +1 day) dw, 
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week iso(current date -day(current date) day +1 day) wk 
from t1 
union all 
select dy+1 day, day(dy+1 day), mth, 

dayofweek(dy-1 day), week iso(dy«1 day) 


from x 
where month(dy+1 day) = mth 
) 
select wk, 
case dw when 2 then dm end as Mo, 
case dw when 3 then dm end as Tu, 
case dw when 4 then dm end as he, 
case dw when 5 then dm end as Th, 
case dw when 6 then dm end as Fr, 
case dw when 7 then dm end as Sa, 
case dw when 1 then dm end as Su 
from x 


WK MO TU WE TH FR SA SU 
22 01 

22 02 

22 03 

22 04 

22 05 
23 06 

23 07 

23 08 

23 09 

23 10 

23 11 

23 12 


在 上 面 的 部 分 输出 结果 里 ， 可 以 看 到 一 周 里 的 每 一 天 都 作为 单独 的 一 行 被 返回 。 现 在 需 
要 以 周 为 单位 为 数据 分 组 ， 并 把 同一 周 的 七 天 合并 为 一 行 。 调 用 聚合 函数 MAX， 并 按照 WK 
(符合 ISO 标准 的 周 序 号 ) 分 组 ， 这 样 就 能 把 一 周 七 天 合并 到 一 行 里 。 为 了 合理 地 安排 输 
出 格式 并 保证 按 日 期 顺序 输出 ， 还 要 根据 wk 对 结果 做 排序 。 最 终结 果 如 下 所 示 。 


with x(dy,dm,mth,dw,wk) 
as ( 
select (current date -day(current date) day +1 day) dy, 
day((current date -day(current date) day +1 day)) dm, 
month(current date) mth, 
dayofweek(current date -day(current date) day +1 day) dw, 
week iso(current date -day(current date) day +1 day) wk 
from t1 
union all 
select dy+1 day, day(dy+1 day), mth, 
dayofweek(dy-1 day), week iso(dy«1 day) 
from x 
where month(dy-1 day) = mth 
) 
select max(case dw when 2 then dm end) as Mo, 
max(case dw when 3 then dm end) as Tu, 





















































LL 
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max(case dw when 4 then dm end) as We, 
max(case dw when 5 then dm end) as Th, 
max(case dw when 6 then dm end) as Fr, 
max(case dw when 7 then dm end) as Sa, 
max(case dw when 1 then dm end) as Su 

from x 

group by wk 

order by wk 


MO TU NWE TH FR SA SU 

01 02 03 04 05 
06 07 08 09 10 11 12 
13 14 15 16 17 18 19 


20 21 22 23 24 25 26 
27 28 29 30 


Oracle 
首先 使 用 CONNECT BY 递归 查询 生成 当前 月 份 的 每 一 天 。 如 果 手 边 没 有 Oracle 9; 或 者 更 高 版 
本 的 数据 库 ， 我 们 就 无 法 按 这 种 方式 使 用 CONNECT BY。 如 此 一 来 ， 则 需要 借助 MySQL 解 
决 方案 里 出 现 过 的 T500 这 样 的 数据 透视 表 。 



































序号 CBE, WK), WITH 视图 X 里 与 当前 月 份 第 一 天 相关 的 查询 结果 如 下 所 示 。 


select trunc(sysdate,'mm') dy, 
to_char(trunc(sysdate,'mm'),'dd') dm, 
to_char(sysdate,'mm') mth, 
to number(to char(trunc(sysdate, 'mm'),'d')) dw, 
to char(trunc(sysdate, 'mm'),'iw') wk 
from dual 





01-JUN-2005 01 06 422 


接 下 来 就 要 不 断 地 递增 DM 值 (在 当前 月 份 里 向 前 推进 )， 直 至 到 达 月 末 。 因 为 我 们 会 遍历 
当前 月 份 的 每 一 天 ， 也 就 能 逐一 获得 每 一 天 是 星期 几 ， 以 及 相应 的 符合 ISO 标准 的 周 序 
号 。 部 分 结果 如 下 所 示 (为 了 增加 可 读 性 ， 额 外 添加 了 每 一 天 的 日 期 )。 


with x 
as ( 
select * 
from ( 
select trunc(sysdate,'mm')+level-1 dy, 
to_char(trunc(sysdate,'mm')+level-1,'iw') wk, 
to_char(trunc(sysdate,'mm')+level-1,'dd') dm, 
to_number(to_char(trunc(sysdate,'mm')+level-1,'d')) dw, 
to_char(trunc(sysdate,'mm')+level-1,'mm') curr_mth, 
to_char(sysdate,'mm') mth 
from dual 
connect by level <= 31 


) 
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where curr_mth = mth 


01-JUN-2005 22 
02-JUN-2005 22 


21-JUN-2005 25 
22-JUN-2005 25 


30-JUN-2005 26 


30 5 06 06 








到 目前 为 止 ， 当 前 月 份 的 每 一 天 都 作为 单独 的 一 行 被 返回 。 每 一 行 包括 : 两 位 数字 表示 的 
1 


日 期 ， 两 位 数字 表示 的 月 份 ， 一 位 数字 表示 的 星期 儿 ( 





7 分 别 代表 从 星期 日 到 星期 六 





的 每 一 天 )， 以 及 两 位 数字 表示 的 、 符 合 ISO 标准 的 周 序号 。 有 了 这 些 信息 ， 我 们 就 能 使 








as ( 


select * 
from ( 

trunc(sysdate,'mm')+level-1 dy, 

to_char(trunc(sysdate,'mm')+level-1,'iw') wk, 

to_char(trunc(sysdate,'mm')+level-1,'dd') dm, 

to_number(to_char(trunc(sysdate,'mm')+level-1,'d')) dw, 

to_char(trunc(sysdate,'mm')+level-1,'mm') curr mth, 

to char(sysdate, 'mm') mth 

from dual 

connect by level «- 31 


select 





用 case 表达 式 来 决定 每 一 个 DM 值 (当前 月 份 的 每 一 天 ) 会 落 到 一 周 的 哪 一 天 。 部 分 查询 
结果 如 下 所 示 。 


with x 


where curr mth = mth 


) 

) 

select wk, 
case 
case 
case 
case 
case 
case 
case 

from x 

WK MO TU WE 

22 01 

22 

22 

22 

22 

23 06 

23 07 


dw 
dw 
dw 
dw 
dw 
dw 
dw 


when 2 then dm end as Mo, 

when 3 then dm end as Tu, 

when 4 then dm end as We, 

when 5 then dm end as Th, 

when 6 then dm end as Fr, 

when 7 then dm end as Sa, 
1 


when 1 then dm end as Su 


FR SA SU 


03 
04 
05 
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23 08 

23 09 

23 10 

23 11 

23 12 


在 上 面 的 部 分 输出 结果 里 ， 可 以 看 到 一 周 里 的 每 一 天 都 作为 单独 的 一 行 被 返回 ， 而 日 期 则 


被 放置 于 7 列 中 与 DW 值 相对 应 的 那 一 列 。 我 们 需要 把 一 周 七 天 都 归并 到 一 行 里 去 。 调 用 











聚合 函数 MAX， 并 按照 wk (符合 ISO 标准 的 周 序号 ) 分 组 ， 这 样 就 能 把 一 周 七 天 合并 到 一 
行 了 。 为 了 保证 按 日 期 顺序 输出 ， 还 要 根据 wk 对 结果 排序 ， 最 终结 果 如 下 所 示 。 








with x 
as ( 
select * 
from ( 
select to char(trunc(sysdate, 'mm')4level-1,'iw') wk, 
to char(trunc(sysdate, 'mm')4level-1,'dd') dm, 
to number(to, char(trunc(sysdate, 'mm')4level-1,'d')) dw, 
to char(trunc(sysdate, 'mm')*level-1,'mm') curr mth, 
to char(sysdate, 'mm' ) mth 
from dual 
connect by level <= 31 


where curr_mth = mth 


select max(case dw when 2 then dm end) Mo, 
max(case dw when 3 then dm end) Tu, 
max(case dw when 4 then dm end) We, 
max(case dw when 5 then dm end) Th, 
max(case dw when 6 then dm end) Fr, 
max(case dw when 7 then dm end) Sa, 
max(case dw when 1 then dm end) Su 

from x 

group by wk 

order by wk 


MO TU WE TH FR SA SU 

01 02 03 04 05 
06 07 08 09 10 11 12 
13 14 15 16 17 18 19 


20 21 22 23 24 25 26 
27 28 29 30 


PostgreSQL 


使 月 








H GENERATE SERIES 函数 把 当前 月 份 的 每 一 天 都 当 作 单独 的 一 行 返 回 。 如 果 你 使 用 的 


PostgreSQL 版 本 不 支持 GENERATE_SERIES， 不 妨 参 考 MySQL 解决 方案 ， 改 为 借助 一 个 数据 
透视 表 来 实现 同样 的 功能 。 

对 于 当前 月 份 的 每 一 天 ， 分 别提 取出 下 列 信息 : 当前 月 份 每 一 天 的 日 期 部 分 (别名 DM)， 
每 一 天 分 别 是 星期 几 (别名 DW)， 当 前 的 月 份 (BA MTH), ARIE ISO 标准 的 周 序号 
(别名 WK)。 尽 管 格式 化 和 显 式 类 型 转换 相关 的 代码 大 大 降低 了 本 解决 方案 的 可 读 性 ， 但 整 
个 查询 其 实 并 不 复杂 。 内 幅 视 图 X 的 部 分 查询 结果 如 下 所 示 。 
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select cast(date trunc('month',current date) as date)+x.id as dy, 


to char( 
cast( 


date trunc('month',current date) 


to char( 
cast( 


as date)sx.id,'iw') as wk, 


date trunc('month',current date) 


cast( 
to char( 
cast( 


as date)sx.id,'dd') as dm, 


date trunc('month',current date) 


to char( 
cast( 


as date)*x.id,'d') as integer) as dw, 


date trunc('month',current date) 


as date)ex.id,'mm') as curr_mth, 
to char(current date,'mm') as mth 


from generate series (0,31) x(id) 


01-JUN-2005 22 
02-JUN-2005 22 


21-JUN-2005 25 
22-JUN-2005 25 


30-JUN-2005 26 


30 


5 06 06 


注意 ， 当 遍历 当前 月 份 的 每 一 天 时 ， 我 们 同时 能 知道 每 一 天 是 星期 几 ， 以 及 符合 ISO 标准 
的 周 序号 。 为 了 保证 遍历 的 范围 不 超出 当前 月 份 ， 我 们 按照 条 件 CURR_MTH = MTH 对 返回 的 
日 期 做 了 过 滤 (每 个 日 期 所 对 应 的 月 份 应 该 是 当前 月 份 )。 到 目前 为 止 ， 得 到 的 结果 包括 : 


两 位 数字 表示 的 日 期 ， 两 位 数字 表示 























的 月 份 ， 一 位 数字 表示 的 星期 几 (1 ~ 7 分 别 代表 从 





星期 日 到 星期 六 的 每 一 天 )， 以 及 两 位 数字 表示 的 、 符 合 ISO 标准 的 周 序号 。 下 一 步 需 要 


使 用 CASE 表达 式 来 决定 每 一 个 DM 值 (当前 月 份 的 每 一 天 ) 会 落 到 





查询 结果 如 下 所 示 。 


select case dw 

case dw 

case dw 

case dw 

case dw 

case dw 

case dw 
from ( 
select * 
from ( 


select cast(date trunc('month',current date) as date)+x.id, 


to_char( 
cast( 


date trunc('month',current, date) 
as date)sx.id, 'iw') as wk, 


when 
when 
when 
when 
when 
when 
when 


to char( 


then 
then 
then 
then 
then 
then 
then 














dm end 
dm end 
dm end 
dm end 
dm end 
dm end 
dm end 


as 
as 
as 
as 
as 
as 
as 


Mo, 
Tu, 
We, 
Th, 
Fr, 
Sa, 
Su 








周 中 的 哪 一 天 。 部 分 
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cast( 
date_trunc('month',current_date) 
as date)+x.id,'dd') as dm, 
cast( 
to_char( 
cast( 
date_trunc('month',current_date) 
as date)+x.id,'d') as integer) as dw, 
to. char( 
cast( 
date trunc('month',current date) 
as date)*x.id,'mm') as curr_mth, 
to char(current date,'mm') as mth 
from generate series (0,31) x(id) 
)x 
where mth = curr  mth 


)y 


WK MO TU WE TH FR SA SU 


22 02 

22 03 

22 04 

22 05 


23 07 

23 08 

23 09 

23 10 

23 11 

23 12 


在 上 面 的 部 分 输出 结果 里 ， 可 以 看 到 一 周 里 的 每 一 天 都 被 作为 单独 的 一 行 被 返回 ， 而 日 期 
则 被 放置 于 7 列 中 与 DW 值 相对 应 的 那 一 列 。 我 们 需要 把 一 周 七 天 都 合并 到 一 行 中 。 因 此 
接 下 来 要 调用 聚合 函数 MAX， 并 按照 W (符合 ISO 标准 的 周 序号 ) 分 组 。 这 样 一 来 ， 我 们 
就 能 把 一 周 七 天 合并 到 一 行 里 去 了 ， 就 像 在 真实 的 日 历 上 看 到 的 那样 。 为 了 保证 按 日 期 顺 
序 输出 ， 还 要 根据 WK 对 结果 做 排序 。 最 终结 果 如 下 所 示 。 


select max(case dw when 
































2 then dm end) as Mo, 
max(case dw when 3 then dm end) as Tu, 
max(case dw when 4 then dm end) as We, 
max(case dw when 5 then dm end) as Th, 
max(case dw when 6 then dm end) as Fr, 
max(case dw when 7 then dm end) as Sa, 
max(case dw when 1 then dm end) as Su 

from ( 

select * 

from ( 
select cast(date_trunc('month',current_date) as date)+x.id, 
to_char( 
cast( 
date trunc('month',current date) 
as date)sx.id, 'iw') as wk, 
to char( 
cast( 





<= 
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date_trunc('month',current_date) 


as date)+x.id,'dd') as dm, 
cast( 


to_char( 


cast( 


date_trunc('month',current_date) 


as date)+x.id,'d') as integer) as dw, 
to_char( 
cast( 


date trunc('month',current date) 


as date)sx.id, 'mm') as curr_mth, 
to char(current date,'mm') as mth 


from generate series (0,31) x(id) 


)x 


where mth = curr, mth 


)y 


group by wk 
order by wk 


MO TU 


06 07 
13 14 
20 21 
27 28 


MySQL 


WE TH FR SA SU 
01 02 03 04 05 
08 09 10 11 12 
15 16 17 18 19 


22 23 24 25 26 
29 30 


首先 为 当前 月 份 的 每 一 天 生成 单独 的 一 行 。 为 了 实现 此 目的 ， 需 要 使 用 T500 表 。 在 当前 月 
份 第 一 天 的 基础 上 依次 加 上 T500 表 的 每 一 个 值 ， 就 能 得 到 当前 月 份 的 每 一 天 了 。 

对 于 每 一 个 日 期 ， 需 要 提取 出 如 下 的 信息 : 当前 月 份 每 一 天 的 日 期 部 分 〈 别 名 DM), ， 每 一 
天 分 别 是 星期 几 〈 别 名 DA) ， 当 前 的 月 份 〈 别 名 MTH) ， 以 及 符合 ISO 标准 的 周 序号 (别名 
WK) 。 内 肯 视 图 X 返 回 当前 月 份 的 第 一 天 ， 以 及 两 位 数字 表示 的 当前 月 份 。 结 果 如 下 所 示 。 


select adddate(current_date, -dayofmonth(current_date)+1) dy, 




















date_format( 

adddate(current_date, 
-dayofmonth(current_date)+1), 
'%m') mth 


from t1 


01-JUN-2005 06 


下 一 步 要 遍历 当前 月 份 ， 从 第 一 天 开始 ， 依 次 返回 当前 月 份 的 每 一 天 。 注 意 ， 我 们 会 遍历 

















当前 月 份 的 每 一 天 ， 并 返回 每 个 日 期 是 星期 几 以 及 符合 ISO 标准 的 周 序号 。 为 了 保证 遍历 








操作 不 超 H 





范围 ， 只 筛选 出 那些 属于 当前 月 份 的 日 期 (每 一 天 对 应 的 月 份 应 该 等 于 当前 日 























HARIH H). ARRIE Y 的 部 分 查询 结果 如 下 所 示 。 


select date_format(dy,'%u') wk, 


date_format(dy,'%d') dm, 
date_format(dy,'%w')+1 dw 
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from 
select 


from 
select 


from 


26 30 


( 
adddate(x.dy,t500.id-1) dy, 
x.mth 
( 
adddate(current_date,-dayofmonth(current_date)+1) dy, 
date_format( 
adddate(current_date, 
-dayofmonth(current_date)+1), 


'%m') mth 
t1 
) x, 
t500 
t500.id <= 31 
date_format(adddate(x.dy,t500.id-1),'%m') = x.mth 
) y 
DW 
4 
5 
3 
4 
5 





对 于 当前 月 份 的 每 一 天 ， 现 在 知道 了 下 列 信息 : 两 位 数字 表示 的 日 期 部 分 (DM)， 一 位 数 
字 表 示 的 星期 几 (DW)， 以 及 两 位 数字 表示 的 、 符 合 ISO 标准 的 周 序号 (WK)。 有 了 这 些 信 
息 之 后 ， 我 们 就 能 借助 CASE 表达 式 来 决定 每 一 个 DM 值 (当前 月 份 的 每 一 天 ) 会 落 到 一 周 
的 哪 一 天 。 部 分 查询 结果 如 下 所 示 。 





select 


from 
select 


from 
select 


from 
select 


from 

















case dw when 2 then dm end as Mo, 
case dw when 3 then dm end as Tu, 
case dw when 4 then dm end as We, 
case dw when 5 then dm end as Th, 
case dw when 6 then dm end as Fr, 
case dw when 7 then dm end as Sa, 
case dw when 1 then dm end as Su 
( 
date_format(dy,'%u') wk, 
date_format(dy,'%d') dm, 
date_format(dy,'%w')+1 dw 
( 
adddate(x.dy,t500.id-1) dy, 
x.mth 
( 
adddate(current_date,-dayofmonth(current_date)+1) dy, 
date_format( 
adddate(current_date, 
-dayofmonth(current_date)+1), 
'%m') mth 
ti 
) x, 
t500 
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where t500.id <= 31 
and date format(adddate(x.dy,t500.id-1),'*m') = x.mth 
)y 
)z 


WK MO TU WE TH FR SA SU 
22 01 

22 02 

22 03 

22 04 

22 05 
23 06 

23 07 

23 08 

23 09 

23 10 

23 11 

23 12 


























在 上 面 的 部 分 输出 结果 里 ， 可 以 看 到 一 周 里 的 每 一 天 都 作为 单独 的 一 行 被 返回 。 每 一 行 


里 ， 日 期 值 都 被 放置 于 与 DW 值 相 对 应 的 那 一 列 。 现 在 我 们 需要 把 一 周 七 天 都 归并 到 一 行 


里 去 。 因 此 要 调用 聚合 函数 MAX， 并 按照 WK (符合 ISO 标准 的 
期 顺序 输出 ， 还 要 根据 wk 对 结果 排序 。 最 终结 果 如 下 所 示 。 


select max(case dw when 

















2 then dm end) as Mo, 
max(case dw when 3 then dm end) as Tu, 
max(case dw when 4 then dm end) as We, 
max(case dw when 5 then dm end) as Th, 
max(case dw when 6 then dm end) as Fr, 
max(case dw when 7 then dm end) as Sa, 
max(case dw when 1 then dm end) as Su 

from ( 
select date_format(dy,'%u') wk, 
date_format(dy,'%d') dm, 
date_format(dy,'%w')+1 dw 
from ( 
select adddate(x.dy,t500.id-1) dy, 
x.mth 
from ( 
select adddate(current date,-dayofmonth(current date)-1) 
date format( 
adddate(current date, 
-dayofmonth(current date)41), 
'%m') mth 
from t1 
) x, 
t500 
where t500.id <= 31 
and date format(adddate(x.dy,t500.id-1),'*m') = x.mth 
)y 
) z 
group by wk 
order by wk 











周 序 号 ) 分 组 。 为 保证 按 日 


dy， 
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MO TU NE TH FR SA SU 
02 03 04 05 
09 10 11 12 
16 17 18 19 
23 24 25 26 
30 


01 
06 07 08 
13 14 15 
20 21 22 
27 28 29 


SQL Server 
首先 把 当前 月 份 的 每 一 天 当 作 间 


独 的 一 行 返回 ， 可 以 使 用 WITH 递归 查询 来 做 到 这 一 点 。 如 





果 你 使 月 





的 日 期 部 分 (别名 DM), 


符合 ISO 标准 的 周 序号 (别名 WK)。 
X 的 查询 结果 如 下 所 示 。 





递归 视图 


select dy, 
day(dy) dm, 


HAJ SQL Server 版 本 不 支持 WITH 递归 查 
数据 透视 表达 到 同样 的 目的 。 对 于 每 一 行 返 回 的 值 ， 











询 ， 可 以 参考 MySQL 的 解决 方案 ， 借 助 
需要 获取 如 下 信息 当前 月 份 每 一 天 
每 一 天 分 别 是 星期 几 (别名 DW)， 当 前 的 月 份 ( 别 名 MTH)， 以 及 


实际 的 递归 操作 发 生 之 前 (UNION ALL 之 前 的 部 分 ) 的 


datepart(m,dy) mth, 

datepart(dw,dy) dw, 

case when datepart(dw,dy) = 1 
then datepart(ww,dy)-1 
else datepart(ww,dy) 


select dateadd(day, -day(getdate())41,getdate()) dy 


end wk 
from ( 
from t1 
)x 
DY DM MTH 
01-JUN-2005 1 6 


接 下 来 就 要 不 断 地 递增 bM 值 ( 

当前 月 份 的 每 一 天 ， 也 就 能 逐一 

号 。 部 分 查询 结果 如 下 所 示 。 
with x(dy,dm,mth,dw,wk) 
as ( 


select dy, 
day(dy) dn, 





DM WK 
4 23 
在 当前 月 份 里 向 前 推进 ) ， 直 至 到 达 月 末 。 因 为 我 们 会 间 历 
获取 到 每 一 天 是 星期 几 ， 以 及 相应 的 符合 ISO 标准 的 周 序 


datepart(m,dy) mth, 

datepart(dw,dy) dw, 

case when datepart(dw,dy) = 1 
then datepart(ww,dy)-1 
else datepart(ww,dy) 


end wk 
from ( 


select dateadd(day, -day(getdate())41,getdate()) dy 


from t1 





union 
select 


all 

dateadd(d,1,dy), day(dateadd(d,1,dy)), mth, 

datepart(dw,dateadd(d,1,dy)), 

case when datepart(dw,dateadd(d,1,dy)) = 1 
then datepart(wk,dateadd(d,1,dy))-1 
else datepart(wk,dateadd(d,1,dy)) 


end 

from x 

where datepart(m,dateadd(d,1,dy)) = mth 
) 
select * 

from x 
DY DM MTH DW WK 
01-JUN-2005 01 06 4 23 
02-JUN-2005 02 06 5 23 
21-JUN-2005 21 (06 3 26 
22-JUN-2005 22 06 4 26 
30-JUN-2005 30 (06 5 27 








对 于 当前 月 份 的 每 一 天 ， 现 在 得 到 的 结果 包括 : 两 位 数字 表示 的 日 期 ， 两 位 数字 表示 的 月 
份 ， 一 位 数字 表示 的 星期 几 (1 ~ 7 分 别 代表 从 星期 日 到 星期 六 的 每 一 天 )， 以 及 两 位 数字 
表示 的 、 符 合 ISO 标准 的 周 序 号 。 


现在 ， 我 们 就 能 使 用 CASE 表达 式 来 决定 每 一 个 DM 值 (当前 月 份 的 每 一 天 ) 会 落 到 一 周 的 
哪 一 天 。 部 分 查询 结果 如 下 所 示 。 





with 
as 
select 


from 
select 
from 


union 
select 


























x(dy,dm,mth,dw,wk) 

( 

dy, 

day(dy) dn, 

datepart(m,dy) mth, 

datepart(dw,dy) dw, 

case when datepart(dw,dy) = 1 
then datepart(ww,dy)-1 
else datepart(ww,dy) 

end wk 

( 

dateadd(day,-day(getdate())+1,getdate()) dy 

t1 

) x 

all 

dateadd(d,1,dy), day(dateadd(d,1,dy)), mth, 

datepart(dw,dateadd(d,1,dy)), 

case when datepart(dw,dateadd(d,1,dy)) = 1 
then datepart(wk,dateadd(d,1,dy))-1 
else datepart(wk,dateadd(d,1,dy)) 

end 

x 

datepart(m,dateadd(d,1,dy)) = mth 
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select 


from 


WK MO 
22 
22 
22 
22 
22 
23 06 
23 
23 
23 
23 
23 
23 


case dw when 2 then dm end as Mo, 
case dw when 3 then dm end as Tu, 
case dw when 4 then dm end as We, 
case dw when 5 then dm end as Th, 
case dw when 6 then dm end as Fr, 
case dw when 7 then dm end as Sa, 
case dw when 1 then dm end as Su 
x 
TU WE TH FR SA SU 


01 


03 
04 
05 


07 
08 
09 
10 
11 
12 





每 一 天 都 作为 单独 的 一 行 被 返回 。 在 每 一 行 里 ， 日 期 值 被 放置 在 与 DW 值 相对 应 的 那 一 列 。 


因此 ， 我 们 需要 把 一 周 七 天 都 归并 到 








ISO 标准 的 周 序号 ) 分 组 ， 并 针对 不 同 的 列 执行 MAX E872 
如 下 所 示 。 


出 ， 














with 
as 
select 


from 
select 
from 


union 
select 





x(dy,dm,mth,dw,wk) 

( 

dy, 

day(dy) dn, 

datepart(m,dy) mth, 

datepart(dw,dy) dw, 

case when datepart(dw,dy) = 1 
then datepart(ww,dy)-1 
else datepart(ww,dy) 

end wk 

( 

dateadd(day,-day(getdate())+1,getdate()) dy 

ti 

)x 

all 

dateadd(d,1,dy), day(dateadd(d,1,dy)), mth, 

datepart(dw,dateadd(d,1,dy)), 

case when datepart(dw,dateadd(d,1,dy)) - 1 
then datepart(wk,dateadd(d,1,dy))-1 
else datepart(wk,dateadd(d,1,dy)) 

end 

x 

datepart(m,dateadd(d,1,dy)) = mth 


max(case dw when 2 then dm end) as Mo, 


I 一 行 里 去 。 为 达到 此 目的 , f 


对 行 数据 按照 WK (符合 




















查询 结果 将 会 以 日 历 的 形式 输 
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max(case 
max(case 
max(case 
max(case 
max(case 
max(case 

from x 

group by wk 

order by wk 


MO TU NE TH FR S 

01 02 03 0 
06 07 08 09 10 1 
13 14 15 16 17 1 


20 21 22 23 24 2 
27 28 29 30 


dw when 
dw when 
dw when 
dw when 
dw when 
dw when 


A SU 
4 05 
112 


8 19 
5 26 


3 then 
4 then 
5 then 
6 then 
7 then 
1 then 


dm 
dm 
dm 
dm 
dm 
dm 


end) as Tu, 
end) as We, 
end) as Th, 
end) as Fr, 
end) as Sa, 
end) as Su 


9.8 列 出 一 年 中 每 个 季度 的 开始 日 期 和 结束 日 期 


1. 问题 


对 于 给 定年 份 的 四 个 季度 ， 分 别 列 出 它们 的 开始 日 期 和 


2. 解决 方案 





结束 日 期 。 


一 年 有 四 个 季度 ， 因 此 需要 生成 4 行 记录 。 在 生成 了 足够 多 的 行 之 后 ， 直 接 调 用 各 个 关系 
数据 库 管 理 系 统 中 的 日 期 函数 返回 每 个 季度 的 开始 日 期 和 结束 日 期 即 可 。 我 们 的 目标 是 生 
这 里 以 生成 当前 年 份 的 记录 为 例 。 




















成 如 下 所 示 的 结果 集 ， 


QTR Q START 





Q. END 


1 01-JAN-2005 31-MAR-2005 
2 01-APR-2005 30-JUN-2005 
3 01-JUL-2005 30-SEP-2005 
4 01-OCT-2005 31-DEC-2005 


DB2 





同时 使 用 EM 表 和 窗口 函数 ROW, NUMBER OVER 生成 4 行 纪 录 。 除 此 之 外 ， 也 可 以 使 用 WITH 
子 句 达到 同样 目的 (正如 许多 实例 的 做 法 一 样 )， 其 至 也 可 以 借助 任何 行 数 不 少 于 4 行 的 








表 。 下 面 的 解决 方案 选择 使 用 ROW NUMBER OVER 国 数 。 








select quarter(dy-1 day) QTR， 
dy-3 month Q_start, 
dy-1 day Q_end 


from ( 


select (current_date - 


+ (rn*3) month) dy 


from ( 


select row_number()over() rn 


from emp 


== 


fetch first 4 rows only 


1 
2 
3 
4 
5 
6 (dayofyear(current_date)-1) day 
7 
8 
9 
0 
i 
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12 
13 


— — 
< x 


Oracle 
使 用 ADD_MONTHS 函数 找到 每 个 季度 的 开始 日 期 和 结束 日 期 。 使 用 ROWNUM 代表 每 个 开始 日 
期 和 结束 日 期 分 别 属于 哪个 季度 。 下 面 的 解决 方案 借助 EM 表 生 成 4 行 记录 。 























1 select rownum qtr， 

2 add_months(trunc(sysdate,'y'),(rownum-1)*3) q_start, 
3 add_months(trunc(sysdate,'y'),rownum*3)-1 q_end 

4 from emp 

5 where rownum <= 4 


PostgreSQL 

使 用 GENERATE, SERIES 国 数 生成 所 需 的 4 个 季度 。 使 用 DATE_TRUNC 函数 对 每 个 季度 的 日 期 
做 截断 处 理 ， 使 之 仅 精确 到 年 份 和 月 份 。 使 用 TO. CHAR 函数 计算 出 每 一 对 开始 日 期 和 结 
日 期 分 别 属 于 哪个 季度 。 














1 select to_char(dy,'Q') as QTR， 

2 date( 

3 date trunc('month',dy)-(2*interval '1 month') 
4 ) as Q start, 

5 dy as Q end 

6 from ( 

7 select date(dy«((rn*3) * interval '1 month'))-1 as dy 
8 from ( 

9 select rn, date(date trunc('year',current date)) as dy 
10 from generate series(1,4) gs(rn) 

11 )x 

12 )y 


MySQL 
使 用 T500 表 生 成 4 行 数据 (每 个 季度 一 行 )。 使 用 DATE ADD 和 ADDDATE 国 数 计算 出 每 个 季 
度 的 开始 日 期 和 结束 日 期 。 使 用 QUARTER 函数 计算 出 每 一 对 开始 和 结束 日 期 分 别 属 于 哪个 
季度 。 











1 select quarter(adddate(dy,-1)) QTR, 

2 date_add(dy,interval -3 month) Q_start, 

3 adddate(dy,-1) Q_end 

4 from ( 

5 select date add(dy,interval (3*id) month) dy 

6 from ( 

7 select id, 

8 adddate(current_date,-dayofyear(current_date)+1) dy 
9 from t500 

10 where id <= 4 


11 ) x 
12 )y 
SQL Server 





使 用 WITH 递归 查询 生成 4 行 数据 。 使 用 DATEADD 函数 找 出 开始 日 期 和 结束 日 期 。 使 用 
DATEPART 函数 计算 出 每 一 对 开始 日 期 和 结束 日 期 分 别 属于 哪个 季度 。 
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with x (dy,cnt) 
as ( 
select dateadd(d,-(datepart(dy,getdate())-1),getdate()), 
1 
from t1 
union all 
select dateadd(m,3,dy), cnt+1 
from x 
9 where cnt+1 <= 4 
10 ) 
11 select datepart(q,dateadd(d,-1,dy)) QTR, 
12 dateadd(m,-3,dy) Q_start, 
13 dateadd(d,-1,dy) Q_end 
14 from x 
15 order by 1 


co NOAN I» Q N FH 


DB2 


首先 生成 4 行 数据 ( 取 值 为 1 到 4)， 每 个 季度 一 行 。 内 嵌 视 图 X 使 用 窗口 函数 ROW. NUMBER 











OVER 和 FETCH FIRST 子 句 ， 仅 返回 EMP RAIAT 4 行 数 据 ， 结 果 如 下 所 示 。 


select row_number()over() rn 
from emp 
fetch first 4 rows only 


RN 


' 
天 ODP 


然后 找 出 当前 年 份 的 第 一 天 ， 然 后 加 上 个 月 , n 是 RN 的 3 倍 (分 别 在 当前 年 份 第 


基础 上 加 上 3 个 月 、6 个 月 、9 个 月 和 12 个 月 )， 结 果 如 下 所 示 。 


select (current_date - 
(dayofyear(current_date)-1) day 
+ (rn*3) month) dy 
from ( 
select row_number()over() rn 
from emp 
fetch first 4 rows only 
)x 


01-APR-2005 
01-JUL-2005 
01-OCT-2005 
01-JAN-2006 








一 天 的 


现在 ,DY 的 值 就 是 每 个 季度 最 后 一 天 再 加 上 1 天 的 日 期 。 下 一 步 要 计算 出 每 个 季度 的 开始 
日 期 和 结束 日 期 。DY 值 减 去 1 天 就 是 每 个 季度 的 结束 日 期 ，DY 减 去 3 个 月 就 是 每 个 季度 的 
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开始 日 期 。 针 对 DY-1 的 值 (每 个 季度 的 最 后 一 天 ) 调用 QUARTER 函数 ， 计 算出 每 一 对 开始 
日 期 和 结束 日 期 分 别 属 于 哪个 季度 。 


Oracle 

把 函数 ROWNUM、TRUNC 和 ADD_MONTHS 组 合 起 来 使 用 ， 就 能 很 容易 地 解决 本 问题 。 为 找 出 每 
个 季度 的 开始 日 期 ， 只 要 在 当前 年 份 第 一 天 的 基础 上 加 上 个 月 即 可 ,n 是 (ROWNUM-1)*3 
(计算 结果 分 别 是 0、3、6 和 9)。 为 找 出 每 个 季度 的 结束 日 期 ， 在 当前 年 份 第 一 天 的 基础 
上 分 别 加 上 个 月 再 减 去 1 天, n 等 于 ROWNUM*3。 顺 便 多 说 一 句 ， 做 季度 相关 的 计算 时 ， 
函数 TO. CHAR 和 TRUNC 搭配 上 格式 化 选项 a 非常 有 用 。 


PostgreSQL 
首先 调用 DATE_TRUNC 函数 截断 当前 日 期 ， 得 到 当前 年 份 第 一 天 。 然 后 ， 加 上 nn 个 月 再 减 去 
1 K, n 是 RN (GENERATE SERIES 函数 的 返回 值 ) 的 3 倍 。 结 果 如 下 所 示 。 


select date(dy+((rn*3) * interval '1 month'))-1 as dy 
from ( 

select rn, date(date trunc('year',current date)) as dy 
from generate series(1,4) gs(rn) 


)x 

















31-MAR-2005 
30- JUN- 2005 
30-SEP-2005 
31-DEC-2005 


现在 得 到 了 每 个 季度 的 结束 日 期 ， 下 一 步 要 找 出 开始 日 期 ， 用 DY 减 去 2 个 月 ， 并 调用 
DATE TRUNC 函数 做 截断 处 理 即 可 。 最 后 ， 针 对 每 个 季度 的 最 后 一 天 (DY) 调用 TO CHAR PR 
数 ， 计 算出 每 一 对 开始 日 期 和 结束 日 期 分 别 属 于 哪个 季度 。 


MySQL 
首先 调用 ADDDATE 和 DAYOFYEAR 函数 找 出 当前 年 份 的 第 一 天 ， 然 后 调用 DATE ADD 函数 在 当 
前 年 份 第 一 天 的 基础 上 加 上 nn 个 月 ，n 等 于 T5090.ID 乘 以 3。 结 果 如 下 所 示 。 


select date add(dy,interval (3*id) month) dy 
from ( 
select id, 
adddate(current date,-dayofyear(current date)41) dy 
from t500 
where id «- 4 


)x 




















01-APR-2005 
01-JUL-2005 
01-OCT-2005 
01-JAN-2006 


现在 得 到 了 每 个 季度 最 后 一 天 再 加 上 1 天 的 日 期 ， 为 了 找 出 每 个 季度 的 结束 日 期 ， 只 要 用 
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DY 值 减 去 1 天 即 可 。 下 一 步 要 找 出 每 个 季度 的 开始 日 期 ， 从 DY 值 里 减 去 3 个 月 即 可 。 在 
每 个 季度 结束 日 期 的 基础 上 调用 QUARTER 函数 计算 出 每 一 对 开始 日 期 和 结束 日 期 分 别 属 于 
哪个 季度 。 


SQL Server 
首先 找 出 当前 年 份 的 第 一 天 ， 然 后 调用 DATEADD 函数 逐次 加 上 nn H, n 是 当前 迭代 次 数 
的 3 倍 (共有 4 次 迭代 ， 因 而 分 别 加 上 了 3x1 个 月 ，3x2 个 月 ， 等 等 )。 结 果 如 下 所 示 。 


with x (dy,cnt) 
as ( 
select dateadd(d,-(datepart(dy,getdate())-1),getdate()), 
1 
from t1 
union all 
select dateadd(m,3,dy), cnt+1 
from x 
where cnt+1 <= 4 
) 
select dy 
from x 






































01-APR-2005 
01-JUL-2005 
01-OCT-2005 
01-JAN-2006 


DY 值 是 每 个 季度 最 后 一 天 再 加 上 1 天 的 日 期 。 为 得 到 每 个 季度 的 结束 日 期 ， 只 要 调用 
DATEADD 函数 从 DY 里 减 去 1 天 即 可 。 为 找 出 每 个 季度 的 开始 日 期 ， 调 用 DATEADD 函数 从 DY 
里 减 去 3 个 月 。 借 助 DATEPART 函数 根据 每 个 季度 的 结束 日 期 计算 出 每 一 对 开始 日 期 和 结束 
日 期 分 别 属于 哪个 季度 。 


99 计算 一 个 季度 的 开始 日 期 和 结束 日 期 


1. 问题 
以 2 和 格式 (前面 4 位 是 年 份 ， 最 后 1 位 是 季度 序号 ) 给 出 了 年 份 和 季度 序号 ， 你 希望 
找 出 该 季度 的 开始 日 期 和 结束 日 期 。 


2. 解决 方案 
本 解决 方案 的 关键 之 处 在 于 如 何 使 用 模 函 数 从 yyyyg 值 里 提取 出 季度 序号 。( 如 果 不 想 使 用 
模 计算 ,也 可 以 简单 地 借助 子 字符 串 函 数 提取 出 yyyyg 的 最 后 一 个 数字 以 得 到 季度 序号 ， 
因为 我 们 知道 前 面 4 位 表示 年 份 。) 得 到 了 季度 序号 之 后 ， 只 要 乘 以 3， 就 能 计算 出 该 季度 
最 后 一 个 月 的 月 份 。 下 述 解决 方案 用 到 的 内 租 视 图 x 里 包含 了 由 年 份 和 季度 序号 组 合 而 成 
的 4 行 数据 。 查 询 内 骨 视 图 X 的 话 ， 会 得 到 下 面 的 结果 集 。 

select 20051 as yrq from t1 union all 


select 20052 as yrq from t1 union all 
select 20053 as yrq from t1 union all 
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select 20054 as yrq from t1 


DB2 
使 用 SUBSTR KRUA ARIILE x 里 提取 出 年 份 ， 使 用 MoD 函数 提取 出 对 应 的 季度 序号 。 


1 select (q_end-2 month) q_start, 

2 (q_end+1 month)-1 day q_end 

3 from ( 

4 select date(substr(cast(yrq as char(4)),1,4) ||'-'| 
5 rtrim(cast(mod(yrq,10)*3 as char(2))) ||'- 
6 from ( 

7 select 20051 yrq from tl union all 

8 select 20052 yrq from t1 union all 

9 select 20053 yrq from t1 union all 

10 select 20054 yrq from t1 


11 )x 
12 )y 
Oracle 


使 用 SUBSTR ARM ARIE x 里 提取 出 年 份 ， 使 用 MoD 函数 提取 出 对 应 的 季度 序号 。 


1 select add_months(q_end,-2) q_start, 

2 last_day(q_end) q_end 

3 from ( 

4 select to_date(substr(yrq,1,4)||mod(yrq,10)*3,'yyyymm') q_end 
5 from ( 

6 select 20051 yrq from dual union all 

7 select 20052 yrq from dual union all 

8 select 20053 yrq from dual union all 

9 select 20054 yrq from dual 


10 )x 
11 )y 
PostgreSQL 


使 用 SUBSTR ARM ARIE X. 里 提取 出 年 份 ， 使 用 MoD 函数 提取 出 对 应 的 季度 序号 。 


1 select date(q end-(2*interval '1 month')) as q_start, 

2 date(q_end+interval '1 month'-interval '1 day') as q end 
3 from ( 

4 select to date(substr(yrq,1,4)| |nod(yrq,10)*3, 'yyyymm') as q end 
5 from ( 

6 select 20051 as yrq from t1 union all 

7 select 20052 as yrq from t1 union all 

8 select 20053 as yrq from t1 union all 

9 select 20054 as yrq from t1 

10 )x 

11 )y 
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MySQL 


使 用 SUBSTR PAZA AERA 


select 


select 





date_add( 


图 X 里 提取 








8 年份， 使 用 MoD 函数 提取 出 对 应 的 季度 序号 。 


adddate(q_end,-day(q_end)+1), 
interval -2 month) q start, 


q end 


( 
last day( 


str to date( 


1 
2 
3 
4 
5 from 
6 
vé 
8 
9 


10 from 
11 select 
12 select 


concat( 


substr(yrq,1,4),mod(yrq,10)*3) , '3?Y*m' )) q end 


( 


20051 as yrq from t1 union all 
20052 as yrq from t1 union all 











年 份 ， 使 用 取 模 运算 符 (0) 提取 出 对 应 的 季度 





1 


as datetime) q_end 


13 select 20053 as yrq from t1 union all 
14 select 20054 as yrq from t1 
15 ) x 
16 ) y 
SQL Server 
使 SUBSTRING ER ZM Iki E x tE Te H u 
序号 。 
1 select dateadd(m,-2,q_end) q_start, 
2 dateadd(d,-1,dateadd(m,1,q end)) q end 
3 from ( 
4 select cast(substring(cast(yrq as varchar),1,4)*'-'4 
5 cast(yrqX10*3 as varchar)-*'-1 
6 from ( 
7 select 20051 yrq from t1 union all 
8 select 20052 yrq from t1 union all 
9 select 20053 yrq from t1 union all 
10 select 20054 yrq from t1 
11 ) x 
12 ) y 
3. 讨论 
DB2 
首先 找 出 需要 处 到 





的 年 份 和 季度 序号 。 调 用 SUBSTR RRM ARIE X (X.YRQ) 里 提取 出 


年 份 。 为 了 获取 季度 序号 ， 用 YR 对 10 取 模 。 得 到 季度 序号 后 ， 乘 以 3 即 得 到 该 季度 最 
后 一 个 月 的 月 份 ， 结 果 如 下 所 示 。 


select substr(cast(yrq as char(4)),1,4) yr, 
mod(yrq,10)*3 mth 


from ( 

















select 20051 yrq from t1 union all 
select 20052 yrq from t1 union all 
select 20053 yrq from t1 union all 
select 20054 yrq from t1 


)x 
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2005 3 
2005 6 
2005 9 
2005 12 








现在 已 经 得 到 了 年 份 和 每 个 季度 最 后 一 个 月 的 月 份 。 利 用 这 些 值 可 以 构建 出 每 个 季度 最 后 
一 个 月 第 一 天 的 日 期 。 使 用 连接 运算 符 || 把 年 份 和 月 份 连接 起 来 ， 然 后 使 用 DATE 函数 将 














其 转换 为 日 期 类 型 。 


select date(substr(cast(yrq as char(4)),1,4) ||'-'|| 

rtrim(cast(mod(yrq,10)*3 as char(2))) ||'-1') q end 
from ( 

select 20051 yrq from t1 union all 

select 20052 yrq from t1 union all 

select 20053 yrq from t1 union all 

select 20054 yrq from t1 
)x 


01-MAR-2005 
01-JUN-2005 
01-SEP-2005 
01-DEC-2005 














ER Q END 值 是 每 个 季度 最 后 一 个 月 的 第 一 天 。 为 了 计算 出 该 季度 的 结束 日 期 ， 只 要 加 上 
1 个 月 ， 然 后 再 减 去 1 天 即 可 。 为 了 找 出 每 个 季度 的 开始 日 期 ， 要 从 Q_END 里 减 去 2 个 月 。 





Oracle 
首先 找 出 需要 处 理 的 年 份 和 季度 序号 。 调 用 SUBSTR 函数 从 内 瞬 视 图 





[I 





X (X.YRQ) 里 提取 








年 份 。 为 获取 季度 序号 ， 用 YRQ 对 10 取 模 。 得 到 季度 序号 后 ， 乘 以 3 即 得 到 该 季度 最 后 


一 个 月 的 月 份 ， 结 果 如 下 所 示 。 


select substr(yrq,1,4) yr, mod(yrq,10)*3 mth 
from ( 

select 20051 yrq from dual union all 

select 20052 yrq from dual union all 

select 20053 yrq from dual union all 

select 20054 yrq from dual 


)x 
YR MTH 
2005 3 
2005 6 
2005 9 
2005 12 











现在 已 经 得 到 了 年 份 和 每 个 季度 最 后 一 个 月 的 月 份 。 利 用 这 些 值 可 以 构建 出 每 个 季度 最 后 
一 个 月 第 一 天 的 日 期 。 使 用 连接 运算 符 || 把 年 份 和 月 份 连接 起 来 ， 然 后 使 用 TO_DATE 函数 





将 其 转换 为 日 期 类 型 。 
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select to_date(substr(yrq,1,4)||mod(yrq,10)*3,'yyyymm') q end 
from ( 
select 20051 yrq from dual union all 
select 20052 yrq from dual union all 
select 20053 yrq from dual union all 
select 20054 yrq from dual 
)x 


01-MAR-2005 
01-JUN-2005 
01-SEP-2005 
01-DEC-2005 


上 述 Q END 值 是 每 个 季度 最 后 一 个 月 的 第 一 天 。 为 计算 出 该 季度 的 结束 日 期 ， 针 对 Q END 
调用 LAsT DAY 国 数 即 可 。 为 找 出 每 个 季度 的 开始 日 期 ， 要 调用 ADD MONTHS 函数 从 Q_END 里 
减 去 2 个 月 。 


PostgreSQL 

首先 找 出 需要 处 理 的 年 份 和 季度 序号 。 调 用 SUBSTR 函数 从 内 和 坐视 图 X (X.YRQ) 里 提取 出 
年 份 。 为 获取 季度 序号 ， 用 YR 对 10 取 模 。 得 到 季度 序号 后 ， 乘 以 3 即 得 到 该 季度 最 后 
一 个 月 的 月 份 ， 结 果 如 下 所 示 。 


select substr(yrq,1,4) yr, mod(yrq,10)*3 mth 
from ( 

select 20051 yrq from dual union all 

select 20052 yrq from dual union all 

select 20053 yrq from dual union all 

select 20054 yrq from dual 
































)x 
YR MTH 
2005 3 
2005 6 
2005 9 
2005 12 


现在 已 经 得 到 了 年 份 和 每 个 季度 最 后 一 个 月 的 月 份 。 利 用 这 些 值 可 以 构建 出 每 个 季度 最 后 
一 个 月 第 一 天 的 日 期 。 使 用 连接 运算 符 || 把 年 份 和 月 份 连接 起 来 ， 然 后 使 用 TO_DATE 函数 
将 其 转换 为 日 期 类 型 。 


select to_date(substr(yrq,1,4)||mod(yrq,10)*3,'yyyymm') q end 
from ( 
select 20051 yrq from dual union all 
select 20052 yrq from dual union all 
select 20053 yrq from dual union all 
select 20054 yrq from dual 
)x 

















01-MAR-2005 
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01-JUN-2005 
01-SEP-2005 
01-DEC-2005 


ER Q_END 值 是 每 个 季度 最 后 一 个 月 的 第 一 天 。 为 计算 出 该 季度 的 结束 日 期 ， 在 QED 基 
础 上 加 上 1 个 月 ， 再 减 去 1 天 即 可 。 为 找 出 每 个 季度 的 开始 日 期 ， 要 从 Q_END 里 减 去 2 个 
月 。 最 后 要 把 计算 结果 转换 为 日 期 类 型 。 


MySQL 

首先 找 出 需要 处 理 的 年 份 和 季度 序号 。 调 用 SUBSTR KAMARE X (X.YRQ) 里 提取 出 
年 份 。 为 获取 季度 序号 ， 用 YR 对 10 取 模 。 得 到 季度 序号 后 ， 乘 以 3 即 得 到 该 季度 最 后 
一 个 月 的 月 份 ， 结 果 如 下 所 示 。 


select substr(yrq,1,4) yr, mod(yrq,10)*3 mth 
from ( 

select 20051 yrq from dual union all 

select 20052 yrq from dual union all 

select 20053 yrq from dual union all 

select 20054 yrq from dual 





























)x 
YR MTH 
2005 3 
2005 6 
2005 9 
2005 12 








现在 已 经 得 到 了 年 份 和 每 个 季度 最 后 一 个 月 的 月 份 。 利 用 这 些 值 可 以 构建 出 每 个 季度 的 结 
束 日 期 。 先 使 用 CONCAT 函数 把 年 份 和 月 份 连接 起 来 ， 然 后 使 用 STR. To. DATE 函数 将 其 转换 
为 日 期 类 型 。 最 后 ， 调 用 LAST_DAY 函数 计算 出 每 个 季度 的 最 后 一 天 。 


select last_day( 
str_to_date( 
concat( 
substr(yrq,1,4),mod(yrq,10)*3),'%Y%m')) q_end 
from ( 
select 20051 as yrq from t1 union all 
select 20052 as yrq from t1 union all 
select 20053 as yrq from t1 union all 
select 20054 as yrq from t1 
)x 








31-MAR-2005 
30- JUN- 2005 
30-SEP-2005 
31-DEC-2005 


因为 我 们 已 经 知道 了 每 个 季度 的 结束 日 期 ， 剩 下 的 工作 就 是 要 计算 出 开始 日 期 。 调 用 DAY 


国 数 计算 出 每 个 季度 的 结束 日 期 分 别 是 当前 月 份 的 第 几 天 ， 接 着 调用 ADDDATE 函数 从 Q_ 
END 里 减 去 该 计算 结果 ， 这 样 就 得 到 了 前 一 个 月 的 最 后 一 天 ， 再 加 上 1 天 ， 就 得 到 了 每 个 



































-A 
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季度 最 后 一 个 月 的 第 一 天 。 最 后 ， 调 用 DATE_ADD 函数 从 上 述 结果 日 期 里 减 去 2 个 月 ， 至 此 
我 们 就 得 到 了 每 个 季度 的 开始 日 期 。 


SQL Server 

首先 找 出 需要 处 理 的 年 份 和 季度 序号 。 调 用 SUBSTRING 函数 从 内 般 视 图 X (X.YRQ) 里 提取 
出 年 份 。 为 获取 季度 序号 ， 用 YRQ 对 10 取 模 。 得 到 季度 序号 后 ， 乘 以 3 即 得 到 该 季度 最 
后 一 个 月 的 月 份 ， 结 果 如 下 所 示 。 


select substring(yrq,1,4) yr, yrq%10*3 mth 
from ( 

select 20051 yrq from dual union all 

select 20052 yrq from dual union all 

select 20053 yrq from dual union all 

select 20054 yrq from dual 












































)x 
YR MTH 
2005 3 
2005 6 
2005 9 
2005 12 


现在 已 经 得 到 了 年 份 和 每 个 季度 最 后 一 个 月 的 月 份 。 利 用 这 些 值 可 以 构建 出 每 个 季度 最 后 
一 个 月 第 一 天 的 日 期 。 使 用 连接 运算 符 + 把 年 份 和 月 份 连接 起 来 ， 然 后 使 用 CAST 函数 将 
其 转换 为 日 期 类 型 。 


select cast(substring(cast(yrq as varchar),1,4)+'-'+ 

cast(yrqX10*3 as varchar)*'-1' as datetime) q end 
from ( 

select 20051 yrq from t1 union all 

select 20052 yrq from t1 union all 

select 20053 yrq from t1 union all 

select 20054 yrq from t1 
)x 











01-MAR-2005 
01-JUN-2005 
01-SEP-2005 
01-DEC-2005 


-EX& Q END 值 是 每 个 季度 最 后 一 个 月 的 第 一 天 。 为 计算 出 该 季度 的 结束 日 期 ， 只 要 调用 
DATEADD 函数 加 上 1 个 月 ， 然 后 再 减 去 1 天 即 可 。 为 找 出 每 个 季度 的 开始 日 期 ， 需 要 调用 
DATEADD 函数 从 Q_END 里 减 去 2 个 月 。 


9.10 填补 缺失 的 日 期 


1. 问题 
你 需要 为 给 定 日 期 区 间 里 的 每 一 天 (每 一 个 月 、 每 一 周 或 者 每 一 年 ) 生成 一 行 数 据 。 类 似 




















日 期 处 理 | 249 











的 行 集 常 用 于 生成 汇总 报表 。 例 如 ， 你 想 计算 每 个 月 新 入 职 的 员工 人 数 ， 只 要 某 个 年 份 有 
新 同事 入 职 ， 则 列 出 该 年 度 内 每 个 月 的 数字 。 仔 细 分 析 全 体 员 工 的 入 职 日 期 的 话 ， 会 发 现 
他 们 的 入 职 日 期 都 介 于 1980 年 和 1983 年 之 间 。 

select distinct 


extract(year from hiredate) as year 
from emp 








你 希望 获得 从 1980 年 到 1983 年 间 每 个 月 新 入 职 的 员工 人 数 ， 期 待 得 到 的 部 分 结果 集 如 下 
所 示 。 


MTH NUM_HIRED 


01-NOV-1981 
01-DEC-1981 


2. 解决 方案 

麻烦 之 处 在 于 我 们 希望 为 每 个 月 都 返回 一 行 数据 ， 即 使 那个 月 没有 新 入 职 的 员工 也 就 是 
说 ， 某 些 月 份 的 计数 值 可 能 为 0) 。 因 为 在 1980 年 和 1983 年 间 并 非 每 个 月 都 有 新 入 职 的 员 
工 ， 我 们 必须 自己 生成 每 个 月 份 对 应 的 记录 ， 然 后 和 EMP 表 的 HIREDATE 做 外 连接 (需要 对 
HIREDATE 做 截断 处 理 ， 使 之 精确 到 月 ， 这 样 才 能 与 我 们 生成 的 月 份 相 匹 配 )。 


DB2 
使 用 WITH 递归 查询 为 每 个 月 生成 一 行 记 录 (每 个 月 的 第 一 天 是 从 1980 年 1 月 1 日 到 1983 
年 12 月 1 日 )。 准备 好 了 所 需 日 期 区 间 内 的 全 部 月 份 记录 之 后 ， 和 EMP 表 进 行 外 连接 ， 并 
使 用 聚合 函数 COUNT 计算 每 个 月 新 入 职 的 员工 人 数 。 
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1 with x (start_date,end_date) 

2 as ( 

3 select (min(hiredate) - 

4 dayofyear(min(hiredate)) day +1 day) start date, 

5 (max(hiredate) - 

6 dayofyear(max(hiredate)) day +1 day) +1 year end date 
7 from emp 

8 union all 





-A 
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9 select start_date +1 month, end_date 


10 from x 

11 where (start date +1 month) < end date 

12 ) 

13 select x.start date mth, count(e.hiredate) num hired 

14 from x left join emp e 

15 on (x.start date - (e.hiredate-(day(hiredate)-1) day)) 


16 group by x.start date 
17 order by 1 


Oracle 

使 用 CONNECT Bv 子 句 生成 1980 年 到 1983 年 间 每 个 月 的 记录 。 然 后 外 连接 EMP 表 ， 并 使 用 
聚合 国 数 COUNT 计算 每 个 月 新 入 职 的 员工 人 数 。 但 是 ，Oracle 8; 及 更 早 版 本 的 数据 库 既 不 
支持 ANSI 标 准 的 外 连接 ， 也 不 能 使 用 CONNECT BY 作为 行 生成 器 。 一 个 简单 的 变通 办 法 是 
使 用 传统 的 数据 透视 表 (参考 MySQL 的 解决 方案 )。 下 面 的 的 解决 方案 使 用 了 Oracle 的 
外 连接 语法 。 


























1 with x 

2 as ( 

3 select add_months(start_date,LeveL-1) start_date 

4 from ( 

5 select min(trunc(hiredate,'y')) start_date, 

6 add_months(max(trunc(hiredate,'y')),12) end_date 
7 from emp 

8 ) 

9 connect by level <= months between(end date,start date) 
10 ) 

11 select x.start date MTH, count(e.hiredate) num hired 

12 from x, emp e 

13 where x.start date = trunc(e.hiredate(4),'mm') 

14 group by x.start date 

15 order by 1 


接着 ， 下 面 展示 了 ANSI 语法 风格 的 第 二 个 Oracle 解决 方案 。 














1 with x 

2 as ( 

3 select add_months(start_date,level-1) start_date 

4 from ( 

5 select min(trunc(hiredate,'y')) start_date, 

6 add_months(max(trunc(hiredate,'y')),12) end_date 
7 

8 


from emp 
) 
9 connect by level <= months between(end date,start date) 
10 ) 
11 select x.start_date MTH, count(e.hiredate) num hired 
12 from x left join emp e 
13 on (x.start date = trunc(e.hiredate, 'mm')) 


14 group by x.start date 
15 order by 1 


PostgreSQL 
为 了 增加 代码 的 可 读 性 ， 本 解决 方案 使 用 视图 V， 该 视图 返回 从 第 一 个 员工 入 职 当 年 的 
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1 月 1 日 开始 ,到 最 近 一 个 新 同事 入 职 当年 的 12 月 1 日 为 止 有 多 少 个 月 。 调 用 GENERATE - 
SERIES 函数 时 ， 把 视图 V 的 返回 值 作为 第 二 个 参数 ， 这 样 就 能 生成 适当 数目 的 月 份 记录 
(GT) 了 。 准 备 好 了 所 需 日 期 区 间 内 的 全 部 月 份 记录 之 后 ， 和 EMP 表 进 行 外 连接 ， 并 使 用 
聚合 函数 COUNT 计算 每 个 月 新 入 职 的 员工 人 数 。 


create view v 
as 
select cast( 
extract(year from age(last month,first month))*12-1 
as integer) as mths 
from ( 
select cast(date trunc('year',min(hiredate)) as date) as first month, 
cast(cast(date trunc('year' ,max(hiredate)) 
as date) + interval '1 year' 
as date) as last month 





























from emp 


)x 


1 select y.mth, count(e.hiredate) as num hired 

2 from ( 

3 select cast(e.start date + (x.id * interval '1 month') 
4 as date) as mth 

5 from generate series (O,(select mths from v)) x(id), 
6 ( select cast( 

7 date trunc('year' ,min(hiredate)) 

8 as date) as start date 

9 from emp ) e 

10 ) y left join emp e 

11 on (y.mth = date trunc('month' ,e.hiredate)) 

12 group by y.mth 

13 order by 1 


MySQL 
使 用 数据 透视 表 T5060 为 1980 年 到 1983 年 间 每 一 个 月 份 生成 一 行 记 录 。 然 后 外 连接 EMP 
表 ， 并 使 用 聚合 函数 COUNT 计算 每 个 月 新 入 职 的 员工 人 数 。 








1 select z.mth, count(e.hiredate) num hired 

2 from ( 

3 select date add(min hd,interval t500.id-1 month) mth 

4 from ( 

5 select min hd, date add(max hd,interval 11 month) max hd 

6 from ( 

7 select adddate(min(hiredate),-dayofyear(min(hiredate))41) min hd, 
8 adddate(max(hiredate),-dayofyear(max(hiredate))4*1) max hd 


9 from emp 

10 )x 

11 ) y, 

12 t500 

13 where date add(min hd,interval t500.id-1 month) <= max hd 
14 ) z left join emp e 

15 on (z.mth - adddate( 

16 date add( 

17 last day(e.hiredate),interval -1 month),1)) 





18 group by z.mth 
19 order by 1 


SQL Server 
使 用 WITH 递归 查询 为 每 个 月 生成 一 行 记录 (每 个 月 的 第 一 天 是 从 1980 ^F. 1 H 1 H #lJ 1983 
年 12 月 1 日 )。 准 备 好 了 所 需 日 期 区 间 内 的 全 部 月 份 记录 之 后 ， 和 EM 表 进 行 外 连接 ， 并 
使 用 聚合 函数 COUNT 计算 每 个 月 新 入 职 的 员工 人 数 。 
with x (start_date,end_date) 
as ( 
select (min(hiredate) - 


1 

2 

3 

4 datepart(dy,min(hiredate))+1) start_date, 
5 dateadd(yy,1, 
6 

7 

8 











(max(hiredate) - 
datepart(dy,max(hiredate))+1)) end date 
from emp 
9 union all 
10 select dateadd(mm,1,start date), end date 


11 from x 

12 where dateadd(mm,1,start date) « end date 

13 ) 

14 select x.start date mth, count(e.hiredate) num hired 
15 from x left join emp e 

16 on (x.start date - 

17 dateadd(dd, -day(e.hiredate)41,e.hiredate)) 


18 group by x.start date 
19 order by 1 


DB2 
首先 生成 1980 年 到 1983 年 间 每 一 个 月 份 (实际 上 是 每 个 月 第 一 天 的 日 期 ) 对 应 的 记录 
行 。 先 针对 HIREDATE 调用 MIN 和 MAX 函数 ， 然 后 把 计算 结果 分 别传 递 给 DAYOFYEAR 函数 。 
select (min(hiredate) - 
dayofyear(min(hiredate)) day +1 day) start date, 
(max(hiredate) - 


dayofyear(max(hiredate)) day +1 day) +1 year end date 
from emp 


START DATE END DATE 


01-JAN-1980 01-JAN-1984 


下 一 步 是 不 断 地 在 START. DATE 基础 上 加 上 1 个 月 ， 生 成 所 有 必要 的 月 份 以 构造 出 最 终 的 结 
RR, ER END DATE 值 比 它 实 际 应 有 的 值 多 1 天 。 不 过 ， 这 也 没有 关系 。 因 为 我 们 要 不 断 
地 在 START DATE 基础 上 加 上 1 个 月 ， 只 要 在 抵达 END. DATE 之 前 中 断 递 归 操 作 即 可 。 生 成 
的 部 分 月 份 如 下 所 示 。 

with x (start_date,end_date) 

as ( 


select (min(hiredate) - 
dayofyear(min(hiredate)) day +1 day) start date, 
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(max(hiredate) - 
dayofyear(max(hiredate)) day +1 day) +1 year end date 

from emp 

union all 
select start date +1 month, end date 

from x 

where (start date +1 month) < end date 
) 
select * 

from x 


START DATE END DATE 


01-JAN-1980 01-JAN-1984 
01-FEB-1980 01-JAN-1984 
01-MAR-1980 01-JAN-1984 


01-OCT-1983 01-JAN-1984 
01-NOV-1983 01-JAN-1984 
01-DEC-1983 01-JAN-1984 


现在 已 经 列 出 了 我 们 所 需 的 全 部 月 份 ， 接 着 要 外 连接 到 EMP.HIREDATE。 因 为 每 一 个 START _ 
DATE 实际 上 是 当前 月 份 的 第 一 天 ， 做 外 连接 时 也 要 把 EMP.HIREDATE 截断 变 成 当前 月 份 的 第 
一 天 。 最 后 ， 要 针对 EMP.HIREDATE 调用 聚合 函数 COUNT, 


Oracle 
首先 生成 1980 年 到 1983 年 间 每 一 个 月 份 的 第 一 天 。 同 时 使 用 TRUNC 和 ADD. MONTHS 函数 ， 
并 针对 HIREDATE 分 别 调用 MIN 和 MAX 函数， 这样 就 能 找到 两 端的 月 份 。 

select min(trunc(hiredate,'y')) start date, 


add_months(max(trunc(hiredate,'y')),12) end date 
from emp 





























START DATE END DATE 


01-JAN-1980 01-JAN-1984 


然后 ， 不 断 地 在 START. DATE 基础 上 加 上 若干 个 月 以 返回 最 终结 果 所 需 的 月 份 。 上 述 END_ 
DATE 值 比 它 实 际 应 有 的 值 多 1 天。 不过， 这 样 也 没有 关系 。 因 为 我 们 要 不 断 地 在 START 
DATE 基础 上 加 上 若干 个 月 ， 只 要 在 抵达 END. DATE 之 前 中 断 递归 操作 即 可 。 生 成 的 部 分 月 
份 如 下 所 示 。 


with x as ( 
select add  months(start date,level-1) start date 
from ( 
select min(trunc(hiredate,'y')) start date, 
add months(max(trunc(hiredate, 'y')),12) end date 
from emp 
) 
connect by level <= months between(end date,start date) 
) 
select * 
from x 























<= 
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START_DATE 





现在 已 经 列 出 了 我 们 所 需 的 全 部 月 份 ， 接 着 要 外 连接 到 EMP.HIREDATE。 因 为 每 一 个 START_ 
DATE 实际 上 是 当前 月 份 的 第 一 天 ， 做 外 连接 时 也 要 把 EMP.HIREDATE 截断 变 成 当前 月 份 的 第 
一 天 。 最 后 ， 针 对 EMP.HIREDATE 调用 聚合 函数 COUNT, 


PostgreSQL 

本 解决 方案 使 用 GENERATE, SERIES 函数 返回 我 们 所 需 的 月 份 。 如 果 和 手边 没有 支持 GENERATE 
SERIES 函数 的 PostgreSQL 版 本 ， 可 以 使 用 MySQL 解决 方案 中 的 数据 透视 表 的 做 法 。 首 先 
要 理解 视图 V。 视 图 V 会 计算 出 需要 生成 多 少 个 月 份 ， 我 们 通过 找 出 给 定 日 期 区 间 的 边界 
值 来 实现 这 一 点 。 视 图 V EAKR X 针对 HIREDATE 调用 MIN 和 MAX 函数 以 计算 出 开始 
日 期 和 结束 日 期 ， 结 果 如 下 所 示 。 


select cast(date trunc('year',min(hiredate)) as date) as first month, 
cast(cast(date trunc('year' ,max(hiredate)) 
as date) + interval '1 year' 
as date) as last month 









































from emp 


FIRST MONTH LAST MONTH 


01-JAN-1980 01-JAN-1984 


EX LAST. MONTH 值 比 它 实际 应 有 的 值 要 多 1 天 。 不 过 ， 这 样 也 没有 关系 。 在 计算 两 个 日 期 
之 间 有 多 少 个 月 时 ， 只 要 在 计算 结果 的 基础 上 减 去 1 即 可 。 下 一 步 要 调用 AGE 函数 找 出 两 
个 日 期 之 间 相 差 多 少年 ， 然 后 乘 以 12 (要 记得 减 去 1)。 

select cast( 


extract(year from age(last month,first month))*12-1 
as integer) as mths 








from ( 
select cast(date trunc('year',min(hiredate)) as date) as first month, 
cast(cast(date trunc('year' ,max(hiredate)) 
as date) + interval '1 year' 
as date) as last month 
from emp 


)x 
MTHS 
47 


把 视图 V 的 返回 值 作为 第 2 个 参数 传递 给 GENERATE, SERIES 函数 ， 这 样 就 能 得 到 所 需 数目 
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的 月 份 。 下 一 步 是 找 出 开始 日 期 。 我 们 不 断 在 开始 日 期 的 基础 上 加 上 若干 个 月 以 生成 所 需 
的 月 份 区 间 。 内 瞬 视 图 Y 针对 MINCHIREDATE) 调用 DATE TRUNC 函数 以 找 出 开始 日 期 ， 并 利 
用 GENERATE, SERIES 国 数 的 返回 值 逐 次 为 该 开始 日 期 加 上 若干 个 月 。 部 分 结果 如 下 所 示 。 


select cast(e.start date + (x.id * interval '1 month') 
as date) as mth 
from generate series (0,(select mths from v)) x(id), 
( select cast( 
date trunc('year' ,min(hiredate)) 
as date) as start date 
from emp 


)e 









































现在 得 到 了 最 终结 果 集 所 需 的 每 一 个 月 份 ， 接 着 要 外 连接 到 EMP.HIREDATE， 并 调用 聚合 函 
数 COUNT 计算 每 个 月 新 入 职员 工 的 人 数 。 


MySQL 
首先 ， 使 用 聚合 函数 MIN FH MAX 以 及 国 数 DAYOFYEAR 和 ADDDATE 找 出 日 期 区 间 的 边界 人 
AERLE X 的 查询 结果 如 下 所 示 。 

select adddate(min(hiredate),-dayofyear(min(hiredate))+1) min hd, 


adddate(max(hiredate),-dayofyear(max(hiredate))*1) max hd 
from emp 








TH 

















MIN_HD MAX_HD 


01-JAN-1980 01-JAN-1983 


下 一 步 ， 对 MAX_HD 做 加 法 以 计算 出 当前 年 份 的 最 后 一 个 月 。 


select min hd, date add(max hd,interval 11 month) max hd 
from ( 
select adddate(min(hiredate), -dayofyear(min(hiredate))4*1) min hd, 
adddate(max(hiredate), -dayofyear(max(hiredate))*1) max hd 
from emp 


)x 


MIN HD MAX. HD 


01-JAN-1980 01-DEC-1983 


现在 我 们 知道 了 日 期 边界 值 ， 接 着 使 用 数据 透视 表 T560 在 MIN H0 m ES —Jn EXE 
月 ， 直 到 抵达 MAX HD 值 ， 这 样 就 生成 了 我 们 所 需要 的 行 记录 。 部 分 结果 如 下 所 示 。 
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select date add(min hd,interval t500.id-1 month) mth 
from ( 
select min hd, date add(max hd,interval 11 month) max hd 
from ( 
select adddate(min(hiredate),-dayofyear(min(hiredate))*1) min hd, 
adddate(max(hiredate), -dayofyear(max(hiredate))4*1) max hd 
from emp 
)x 
) y, 
t500 
where date add(min hd,interval t500.id-1 month) <= max hd 























现在 已 经 准备 好 最 终结 果 所 需 的 全 部 月 份 ， Re S ss 





HIREDATE 值 ， 使 之 变 成 当前 月 份 的 第 一 天 )， 并 针对 EMP.HIREDATE jB H EE 
计算 每 个 月 新 入 职员 工 的 人 数 。 


SQL Server 





首先 为 从 1980 年 到 1983 年 间 每 个 月 份 (实际 上 是 每 个 月 的 第 一 天 A) 生成 一 行 














后 ， 针 对 HIREDATE 分 别 执行 MIN 和 MAX 函数 ， 再 调用 DAYOFYEAR 函数 ， 这 样 就 和 
期 区 间 两 端的 月 份 。 


select (min(hiredate) - 
datepart(dy,min(hiredate))+1) start_date, 
dateadd(yy,1, 
(max(hiredate) - 
datepart(dy,max(hiredate))*1)) end date 
from emp 





START DATE END DATE 


01-JAN-1980 01-JAN-1984 


国 数 COUNT 以 


记录 。 然 
6 计 算出 日 


下 一 步 要 不 断 地 在 START_DATE 基础 上 加 上 若干 个 月 以 返回 最 终结 果 集 所 需 的 月 份 。 上 述 
END_DATE 值 比 它 实际 应 有 的 值 多 1 天 ; 不 过 没有 关系 ， Sl START_DATE 
基础 上 加 上 若干 个 月 ， 只 要 在 抵达 END. DATE 之 前 中 断 递归 操作 即 可 。 生 成 的 部 分 月 份 如 








下 所 示 。 


with x (start_date,end_date) 
as ( 
select (min(hiredate) - 
datepart(dy,min(hiredate))+1) start date, 
dateadd(yy,1, 
(max(hiredate) - 
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datepart(dy,max(hiredate))+1)) end date 
from emp 
union all 
select dateadd(mm,1,start date), end date 
from x 
where dateadd(mm,1,start date) < end, date 


) 
select * 
from x 


START DATE END DATE 


01-JAN-1980 01-JAN-1984 
01-FEB-1980 01-JAN-1984 
01-MAR-1980 01-JAN-1984 


01-OCT-1983 01-JAN-1984 
01-NOV-1983 01-JAN-1984 
01-DEC-1983 01-JAN-1984 


现在 已 经 列 出 了 我 们 所 需 的 全 部 月 份 ， 接 着 要 外 连接 到 EMP.HIREDATE。 因 为 每 一 个 START_ 


DATE 实际 上 是 当前 月 份 的 第 一 天 ， 做 外 连接 时 也 要 把 EMP . HIREDATE 截断 变 成 当前 月 份 的 第 
一 天 。 最 后 ， 针 对 EMP.HIREDATE 调用 聚合 函数 COUNT, 


` r3 * Ah S AJ LA 
9.11 依据 特定 时 间 单 位 检索 数据 
1. 问题 
你 想 依据 指定 的 月 份 、 星 期 或 者 其 他 时 间 单 位 来 科 选 记录 行 。 例 如 ， 你 希望 找 出 入 职 月 
份 是 February (2 H) 或 者 December (12 H), 并 且 入 职 当天 是 Tuesday (星期 二 ) 的 所 
有 员工 。 




































































2. 解决 方案 
使 用 关系 数据 库 管理 系统 中 的 国 数 来 找 出 一 个 日 期 值 对 应 的 月 份 和 星期 。 在 很 多 情况 下 ， 
本 实例 可 能 都 会 有 用 。 试 想 ， 如 果 我 们 希望 依据 HIREDATE 做 一 些 检索 ， 但 又 想 忽略 年 





份 ， 只 按照 月 份 检 索 (或 者 按照 HIREDATE 里 其 他 我 们 感 兴趣 的 时 间 单位 来 检索 )， 这 个 
时 候 本 实例 提供 的 技巧 就 有 了 用 武之 地 。 下 面 给 出 的 解决 方案 以 月 份 和 星期 的 检索 为 例 。 
掌握 了 各 种 数据 库 提 供 的 日 期 格式 化 函数 之 后 ， 我 们 就 能 很 方便 地 修改 这 些 解 决 方案 以 
实现 按照 年 份 检索 ， 按 照 季 度 检索 ， 按 照 年 份 和 季度 的 组 合 检索 ， 按 照 月 份 和 年 份 的 组 


合 检索 ， 等 等 。 


DB2 和 MySQL 
使 用 函数 MONTHNAME 和 DAYNAME 分 别 找 出 员工 入 职 日 期 所 对 应 的 月 份 和 星期 。 











1 select ename 

2 from emp 

3 where monthname(hiredate) in ('February', December ') 
4 or dayname(hiredate) = 'Tuesday' 





Oracle 和 PostgreSQL 
使 用 TO, CHAR 函数 找 出 员工 入 职 日 期 对 应 的 月 份 和 星期 使 用 RTRIM 函数 过 滤 掉 尾部 的 空 
格 字 符 。 


1 select ename 

2 from emp 

3 where rtrim(to char(hiredate,'month')) in ('february','december') 
4 or rtrim(to char(hiredate,'day')) = 'tuesday' 








SQL Server 
使 用 DATENAME 函数 找 出 员工 入 职 日 期 对 应 的 月 份 和 星期 。 





N 


1 select ename 

2 from emp 

3 where datename(m,hiredate) in ('February', December ') 
4 or datename(dw,hiredate) - 'Tuesday' 


3. 讨论 

对 于 以 上 所 有 解决 方案 而 言 ， 关 键 在 于 知道 要 调用 哪个 函数 以 及 如 何 调 用 。 如 果 想 确认 每 
个 函数 返回 的 结果 值 ， 不 妨 在 SELECT 子 句 后 面 直接 调用 相应 的 函数 并 检查 其 输出 结果 。 下 
面 列 出 了 DEPTNO 等 于 10 的 员工 对 应 的 查询 结果 集 。 


select ename,datename(m,hiredate) mth,datename(dw,hiredate) dw 
from emp 
where deptno - 10 
































= 





ENAME MTH DW 


CLARK June Tuesday 
KING November Tuesday 
MILLER January Saturday 


— HAME THAI K ROR MARE, IARA ERARA se EHA E EROR ETK 
就 非常 容易 了 。 


9.12 比较 特定 的 日 期 要 素 


1. 问题 

你 想 找 出 哪些 员工 在 同一 个 月 份 和 同一 个 工作 日 人 职 。 例 如 ， 一 个 员工 的 入 职 日 期 是 1988 
年 3 月 10 日 ， 星 期 一 ， 另 一 个 则 是 2001 年 3 月 2 日 ， 星 期 一 。 那 么 ， 由 于 二 者 的 月 份 名 
称 和 星期 值 一 致 ， 你 认为 他 们 两 个 的 入 职 日 期 是 相 匹配 的 。 对 于 EMP 表 而 言 ， 只 有 3 个 员 
工 符合 这 种 条 件 。 你 希望 得 到 的 结果 集 如 下 所 示 。 

















JAMES was hired on the same month and weekday as FORD 
SCOTT was hired on the same month and weekday as JAMES 
SCOTT was hired on the same month and weekday as FORD 
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2. 解决 方案 





















































我 们 希望 把 一 个 员工 的 HIREDATE 与 另 一 个 员 iu HIREDATE AREA 因而 需要 对 EMP 表 做 
O 下 。 然 后 ， 只 需 提取 出 
每 一 个 HIREDATE 的 星期 值 和 月 份 并 做 比较 即 可 。 
DB2 
EMP 表 自 连接 之 后 ， 使 用 DAYOFWEEK 函数 返回 一 个 数值 表示 星期 几 。 使 用 MONTHNAME 函数 返 
回 月 份 名 称 。 
1 select a.ename || 
2 ' was hired on the same month and weekday as '|| 
3 b.ename msg 
4 from emp a, emp b 
5 where (dayofweek(a.hiredate),monthname(a.hiredate)) = 
6 (dayofweek(b.hiredate),monthname(b.hiredate)) 
7 and a.empno < b.empno 
8 order by a.ename 
Oracle 和 PostgreSQL 
EMP 自 连 接 之 后 ， 使 用 TO CHAR 函数 格式 化 HIREDATE 得 到 筛选 条 件 里 的 星期 值 和 月 份 。 
1 select a.ename || 
2 ' was hired on the same month and weekday as '| 
3 b.ename as msg 
4 from emp a, emp b 
5 where to char(a.hiredate,'DMON') = 
6 to_char(b.hiredate, 'DMON') 
7 and a.empno < b.empno 
8 order by a.ename 
MySQL 
EMP 表 自 连接 之 后 ， 使 用 DATE FORMAT 图 数 格式 化 HIREDATE $3 F fiii As fi E BJ Æ UT ELI 
月 份 。 
1 select concat(a.ename, 
2 ' was hired on the same month and weekday as ', 
3 b.ename) msg 
4 from emp a, emp b 
5 where date format(a.hiredate, '?9wX4M') = 
6 date format(b.hiredate, '%w%M') 
7 and a.empno « b.empno 
8 order by a.ename 
SQL Server 
EMP 自 连 接 之 后 ， 使 用 DATENAME 函数 格式 化 HIREDATE 15-5 je 2 FB BJ BA z H 09 
1 select a.ename + 
2 ' was hired on the same month and weekday as “+ 
3 b.ename msg 
4 from emp a, emp b 
5 where datename(dw,a.hiredate) - datename(dw,b.hiredate) 
6 and datename(m,a.hiredate) = datename(m,b.hiredate) 
7 and a.empno « b.empno 
8 order by a.ename 
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3. 讨论 


以 上 几 种 解决 方案 只 在 格式 化 HIREDATE 时 用 到 了 不 同 的 日 期 国 数 。 下 面 的 讨论 部 分 将 以 
Oracle 和 PostgreSQL 的 解决 方案 为 例 (因为 该 解决 方案 最 为 简短 ) ， 尽 管 如 此 ， 下 面 的 讲 
解 内 容 也 同样 适用 于 其 他 解决 方案 。 


首先 用 EMP 表 做 
下 面 的 查询 结 














select 
from 
where 


and 


SCOTT 








emp a, emp b 


a.ename = 'SCOTT' 

a.empno != b.empno 
SCOTT_HD OTHER_EMPS OTHER_HDS 
09-DEC-1982 SMITH 17-DEC-1980 
09-DEC-1982 ALLEN 20-FEB-1981 
09-DEC-1982 WARD 22-FEB-1981 
09-DEC-1982 JONES 02-APR-1981 
09-DEC-1982 MARTIN 28-SEP-1981 
09-DEC-1982 BLAKE 01-MAY-1981 
09-DEC-1982 CLARK 09-JUN-1981 
09-DEC-1982 KING 17-NOV-1981 
09-DEC-1982 TURNER 08-SEP-1981 
09-DEC-1982 ADAMS 12-JAN-1983 
09-DEC-1982 JAMES 03-DEC-1981 
09-DEC-1982 FORD 03-DEC-1981 
09-DEC-1982 MILLER 23-JAN-1982 


自 连 接 查 询 ， 这 样 每 个 员工 都 能 访问 其 他 员工 的 HIREDATE。 我 们 来 看 一 下 
(只 筛选 出 了 与 员工 SCOTT 相关 的 数据 ) 。 


a.ename as scott, a.hiredate as scott hd, 
b.ename as other emps, b.hiredate as other hds 


通过 EMP 表 自 连接 查询 ， 我 们 把 SCOTT 的 HIREDATE 和 所 有 其 他 员工 的 HIREDATE 做 了 比 
较 。 筛 选 条 件 里 的 EMPNO 表明 SCOTT 的 HIREDATE 不 会 作为 OTHER HDS 列 返 回 。 下 一 步 
和 月 份 ， 并 只 保留 相 匹 


要 使 用 数据 库 内 置 的 日 期 格式 化 函数 比较 HIREDATE 对 应 的 星期 值 









































配 的 行 。 
select a.ename as emp1, a.hiredate as emp1_hd ， 
b.ename as emp2, b.hiredate as emp2 hd 
from emp a, emp b 
where to char(a.hiredate, 'DMON') = 
to char(b.hiredate, 'DMON') 
and a.empno !- b.empno 
order by 1 
EMP1 EMP1 HD EMP2 EMP2 HD 
FORD 03-DEC-1981 SCOTT 09-DEC-1982 
FORD 03-DEC-1981 JAMES 03-DEC-1981 
JAMES 03-DEC-1981 SCOTT 09-DEC-1982 
JAMES 03-DEC-1981 FORD 03-DEC-1981 
SCOTT 09-DEC-1982 JAMES 03-DEC-1981 
SCOTT 09-DEC-1982 FORD 03-DEC-1981 
现在 ，HIREDATE 都 已 经 正确 地 匹配 出 来 了 ， 但 是 我 们 得 到 了 6 行 查询 结果 ， 而 不 是 前 面 讲 
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过 的 3 行 。 这 是 因为 篇 选 条 件 EMN 导致 了 多 余 的 行 。 使 用 “不 等 于 ”作为 筛选 条 件 ， 我 
们 就 没有 办 法 过 滤 掉 反 向 的 查询 结果 。 例 如 ， 上 述 第 一 行 是 FORD 匹配 SCOTT 的 结果 ， 
而 最 后 一 行 则 是 SCOTT 匹配 FORD。 结 果 集 里 出 现 了 6 钙 从 技术 上 讲 虽然 没 错 ， 
实际 上 却 出 现 了 重复 数据 。 我 们 可 以 改 用 “小 于 ”作为 筛选 条 件 以 避免 出 现 重复 数据 。 
(下 面 的 查询 语句 去 掉 了 HIREDATE， 这 样 查询 结果 会 更 接近 

select a.ename as empl, b.ename as emp2 

from emp a, emp b 

where to_char(a.hiredate, 'DMON') = 


to char(b.hiredate, 'DMON') 
and a.empno « b.empno 














order by 1 

EMP1 EMP2 
JAMES FORD 
SCOTT JAMES 
SCOTT FORD 




















最 后 ， 只 要 把 上 述 查询 结果 连接 起 来 变 成 符合 要 求 的 内 容 即 可 。 


9.13 识别 重 妥 的 日 期 区 间 











1. 问题 
如 果 一 个 员工 手头 现 有 的 项 目 尚未 结束 ， 却 又 开始 了 另 一 个 新 项 目 ， 那 么 你 希望 得 选 出 相 
关 的 数据 。 我 们 先 看 一 下 EMP_PR0JECT 表 的 数据 。 
select * 


from emp_project 


EMPNO ENAME PROJ ID PROJ START PROJ_END 

7782 CLARK 1 16-JUN-2005 18-JUN-2005 
7782 CLARK 4 19-JUN-2005 24-JUN-2005 
7782 CLARK 7 22-JUN-2005 25-JUN-2005 
7782 CLARK 10 25-JUN-2005 28-JUN-2005 
7782 CLARK 13 28-JUN-2005 02-JUL-2005 
7839 KING 2 17-JUN-2005 21-JUN-2005 
7839 KING 8 23-JUN-2005 25-JUN-2005 
7839 KING 14 29-JUN-2005 30-JUN-2005 
7839 KING 11 26-JUN-2005 27-JUN-2005 
7839 KING 5 20-JUN-2005 24-JUN-2005 
7934 MILLER 3 18-JUN-2005 22-JUN-2005 
7934 MILLER 12 27-JUN-2005 28-JUN-2005 
7934 MILLER 15 30-JUN-2005 03-JUL-2005 
7934 MILLER 9 24-JUN-2005 27-JUN-2005 
7934 MILLER 6 21-JUN-2005 23-JUN-2005 


看 一 下 上 述 查询 结果 ， 员 工 KING 在 PROJ ID 5£ c l PROJ ID 8， 并 且 它 开始 
PROJ ID 5 的 时 候 ，PR0]J_ID 2 还 没有 完结 。 因 此 ， 你 希望 得 到 的 结果 集 如 下 所 示 。 


























7782 CLARK project 7 overlaps project 4 
7782 CLARK project 10 overlaps project 7 
7782 CLARK project 13 overlaps project 10 
7839 KING project 8 overlaps project 5 
7839 KING project 5 overlaps project 2 
7934 MILLER project 12 overlaps project 9 
7934 MILLER project 6 overlaps project 3 
2. 解决 方案 


这 里 的 关键 之 处 在 于 要 找 出 那些 PRo]_START (新 项 目 开始 的 日 期 ) 等 于 或 者 大 于 另 一 个 项 
H PROJ_START 的 行 ， 以 及 等 于 或 者 小 于 其 他 项 目 PR03_END 的 行 。 因 此 ， 首 先 要 逐个 地 比 
较 〈 同 一 个 员工 的 ) 每 一 个 项 目 和 其 他 项 目 。 通 过 自 连 接 EMP_PR03ECT 表 ， 我 们 为 每 一 个 
员工 生成 全 部 可 能 的 项 目 组 合 。 为 找到 日 期 重 又 的 项 目 ， 只 要 在 同一 个 员工 的 项 目 里 找 出 
PR0J_START 介 于 另 一 个 PR0]_START 和 PROJ_END 之 间 的 那些 行 即 可 。 








DB2、PostgreSQL 和 Oracle 





EMP. PROJECT 表 
求 的 输出 结果 。 


1 select 
2 
3 
4 
5 
6 
7 
8 
9 
MySQL 


EMP PROJECT 表 
的 输出 结果 。 





select 


1 
2 
3 
4 
5 
6 
7 
8 
9 


SQL Server 

EMP_PROJECT 表 

求 的 输出 结果 。 
1 select 


2 
3 


自 连接 ， 然 后 使 用 连接 运算 符 || 为 时 间 上 发 生 了 重合 的 项 目 构 造 出 符合 要 





a.empno,a.ename, 
'project '||b.proj_id|| 
' overlaps project '||a.proj id as msg 
emp project a, 
emp project b 
a.empno - b.empno 
b.proj start »- a.proj start 
b.proj start «- a.proj end 
a.proj id !- b.proj id 





自 连 接 ， 然 后 使 用 CONCAT 函数 为 时 间 上 发 生 了 重合 的 项 目 构造 出 符合 要 求 





p 





a.empno,a.ename, 
concat('project ',b.proj id, 
' overlaps project ',a.proj id) as msg 
emp project a, 
emp project b 
a.empno - b.empno 
b.proj start »- a.proj start 
b.proj start «- a.proj end 
a.proj id !- b.proj id 


自 连接 ， 然 后 使 用 连接 运算 符 + 为 时 间 上 发 生 了 重合 的 项 目 构 造 出 符合 要 





a.empno,a.ename, 
'project '+b.proj_id+ 
' overlaps project '+a.proj_id as msg 
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4 
5 
6 
7 
8 
9 


from 


where 
and 
and 
and 


3. 讨论 
上 述 各 个 解决 方案 之 间 的 差别 仅 在 于 字符 串 连 接 方 式 不 同 ， 接 下 来 的 讨论 里 会 使 用 DB2 
语法 ， 但 仍然 能 兼顾 全 部 3 种 解决 方案 。 首 先 自 连 接 EMP_PR0JECT 表 ， 这 样 PROJ_START H 


期 值 就 能 和 其 他 项 目 逐一 地 做 比较 了 。 下 画 


emp_project a， 

emp_project b 

a.empno = b.empno 
b.proj_start >= a.proj_start 
b.proj_start <= a.proj_end 
a.proj id != b.proj id 




















现 ， 每 一 个 项 目 是 怎样 “看 见 ” 其 他 项 目的 。 


select a.ename, 


从 上 面 的 结果 集 里 可 以 看 到 ， 自 


a.proj id as a id, 
a.proj start as a start, 
a.proj end as a end, 
b.proj id as b id, 
b.proj start as b start 


i 是 针对 员工 KING 的 自 


23-JUN-2005 
29-JUN-2005 
26-JUN-2005 
20- JUN-2005 
17-JUN- 2005 
23- JUN-2005 
26- JUN-2005 
29- JUN-2005 
17-JUN- 2005 
29- JUN-2005 
20- JUN-2005 
26- JUN-2005 
17-JUN- 2005 
23- JUN-2005 
29- JUN-2005 
20- JUN-2005 
17-JUN- 2005 
23- JUN-2005 
20- JUN-2005 


from emp project a, 
emp project b 

where a.ename = 'KING' 

and a.empno = b.empno 

and a.proj id !- b.proj id 

order by 2 
ENAME A ID A START A END 
KING 2 17-JUN-2005 21-JUN-2005 
KING 2 17-JUN-2005 21-JUN-2005 
KING 2 17-JUN-2005 21-JUN-2005 
KING 2 17-JUN-2005 21-JUN-2005 
KING 5 20-JUN-2005 24-JUN-2005 
KING 5 20-JUN-2005 24-JUN-2005 
KING 5 20-JUN-2005 24-JUN-2005 
KING 5 20-JUN-2005 24-JUN-2005 
KING 8 23-JUN-2005 25-JUN-2005 
KING 8 23-JUN-2005 25-JUN-2005 
KING 8 23-JUN-2005 25-JUN-2005 
KING 8 23-JUN-2005 25-JUN-2005 
KING 11 26-JUN-2005 27-JUN-2005 
KING 11 26-JUN-2005 27-JUN-2005 
KING 11 26-JUN-2005 27-JUN-2005 
KING 11 26-JUN-2005 27-JUN-2005 
KING 14 29-JUN-2005 30-JUN-2005 
KING 14 29-JUN-2005 30-JUN-2005 
KING 14 29-JUN-2005 30-JUN-2005 
KING 14 29-JUN-2005 30-JUN-2005 





26- JUN-2005 


连接 查询 使 得 寻找 重合 日 期 


连接 查询 结果 。 可 以 发 





区 间 的 工作 变 得 容易 多 了 。 只 





要 筛选 出 B START 介 于 A_START 和 A_END 之 间 的 那些 行 即 可 。DB2 解决 方案 第 7 行 和 第 8 


行 的 WHERE 条 件 做 的 就 是 这 件 事 。 





i 
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第 9 = 


and b.proj_start >= a.proj_start 
and b.proj_start <= a.proj_end 


找到 了 所 需 的 行 之 后 ， 接 下 来 只 


























连接 字符 串 构造 出 适当 格式 的 输出 结果 即 可 。 


如 果 每 一 个 员工 的 最 大 项 目 个 数 是 固定 的 ， 那 么 Oracle 用 户 就 可 以 利用 窗口 函数 LEAD 
能 显得 代价 过 于 沉重 
(如 果 自 连接 耗费 的 机 器 资源 远大 于 LEAD 0VER)， 这 个 时 候 LEAD OVER 函数 就 不 失 为 一 种 简 


OVER 来 避免 使 用 自 连 接 查询 。 在 某 些 特定 情况 下 使 月 














TER UR. flin, IE 


select empno, 
ename, 
proj. id, 
proj start, 
proj end, 
case 





























j 针 对 员工 KING 的 LEAD OVER 替代 方案 。 


when lead(proj_start,1)over(order by proj_start) 
between proj_start and proj_end 

then lead(proj id)over(order by proj_start) 

when lead(proj_start,2)over(order by proj_start) 
between proj_start and proj_end 

then lead(proj id)over(order by proj start) 

when lead(proj start,3)over(order by proj start) 
between proj start and proj. end 

then lead(proj id)over(order by proj start) 

when lead(proj start,4)over(order by proj start) 
between proj start and proj. end 

then lead(proj id)over(order by proj start) 

end is overlap 


from emp project 


where ename - 'KING' 


EMPNO ENAME  PROJ, ID 


PROJ, START  PROJ, END 


IS OVERLAP 


7839 KING 2 17-JUN-2 
7839 KING 5 20-JUN-2 
7839 KING 8 23-JUN-2 
7839 KING 11 26-JUN-2 
7839 KING 14 29-JUN-2 


005 21-JUN-2005 
005 24-JUN-2005 
005 25-JUN-2005 
005 27-JUN-2005 
005 30-JUN-2005 


日 自 连接 查询 可 


对 于 员工 KING， 因 为 项 目 个 数 被 限定 为 5 个， 我 们 就 能 使 用 LEAD OVER 图 数 逐一 检查 全 前 
项 目的 日 期 值 ， 而 无 须 自 连 接 查 询 。 现 在 ， 离 最 终 的 结果 集 只 有 一 步 之 过 了 。 接 下 来 只 要 


把 IS_OVERLAP 不 是 Null 


select empno,ename, 





























AJAT io H 


来 即 可 。 


'project '||is_overlap|| 
' overlaps project '||proj id msg 


from ( 
select empno, 
ename, 
proj. id, 
proj. start, 
proj end, 
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case 
when lead(proj_start,1)over(order by proj start) 
between proj start and proj end 
then lead(proj id)over(order by proj start) 
when lead(proj start,2)over(order by proj start) 
between proj start and proj end 
then lead(proj id)over(order by proj start) 
when lead(proj start,3)over(order by proj start) 
between proj start and proj end 
then lead(proj id)over(order by proj start) 
when lead(proj. start,4)over(order by proj start) 
between proj start and proj end 
then lead(proj id)over(order by proj start) 
end is overlap 
from emp project 
where ename - 'KING' 
) 


where is overlap is not null 


EMPNO ENAME MSG 
7839 KING project 5 overlaps project 2 
7839 KING project 8 overlaps project 5 


为 了 让 以 上 解决 方案 适用 于 全 体 员工 (而 不 局 限于 KING)， 要 在 LEAD OVER 函数 调用 里 加 
上 针对 ENAME 的 分 区 。 


select empno,ename, 
'project '||is overlap|| 
' overlaps project '||proj id msg 
from ( 
select empno, 
ename, 
proj. id, 
proj. start, 
proj. end, 
case 
when lead(proj start,1)over(partition by ename 
order by proj start) 
between proj start and proj end 
then lead(proj id)over(partition by ename 
order by proj start) 
when lead(proj start,2)over(partition by ename 
order by proj start) 
between proj start and proj end 
then lead(proj id)over(partition by ename 
order by proj start) 
when lead(proj start,3)over(partition by ename 
order by proj start) 
between proj start and proj end 
then lead(proj id)over(partition by ename 
order by proj start) 
when lead(proj start,4)over(partition by ename 
order by proj start) 





between proj_start and proj_end 
then lead(proj id)over(partition by ename 
order by proj start) 
end is overlap 
from emp project 


where is overlap is not null 


EMPNO ENAME MSG 

7782 CLARK project 7 overlaps project 4 
7782 CLARK project 10 overlaps project 7 
7782 CLARK project 13 overlaps project 10 
7839 KING project 5 overlaps project 2 
7839 KING project 8 overlaps project 5 
7934 MILLER project 6 overlaps project 3 
7934 MILLER project 12 overlaps project 9 
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第 10 章 


区 间 查 询 





本 章 将 介绍 与 区 间 相 关 的 日 常 查询 。 区 间 在 日 常生 活 中 很 常见 。 例 如 ， 我 们 每 天 为 之 努力 
工作 的 项 目 就 限定 在 一 个 连续 的 时 间 区 间 里 。 在 SQL 中 ， 经 常 需要 针对 一 个 区 间 做 检索 ， 
或 者 生成 某 个 值 区 间 ， 抑 或 对 某 个 区 间 内 的 数据 做 一 些 处 理 。 本 章 的 查询 将 会 比 前 面 几 章 
的 更 复杂 一 些 ， 但 它们 也 是 常用 的 查询 。 一 旦 我 们 真正 掌握 了 相关 技术 ， 将 会 真切 感受 到 
SQL 的 威力 。 


10.1 定位 连续 的 值 区 间 


1. 问题 
你 想 确 定 哪些 行 代 表 了 一 系列 在 时 间 上 连续 的 项 目 。 考 上 处 下 述 视图 V 的 结果 集 ， 它 包含 了 
项 目 编号 以 及 各 自 的 起 止 日 期 。 


select * 
from V 


















































PROJ, ID PROJ, START PROJ END 
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12 27-JAN-2005 
13 28-JAN-2005 
14 29-JAN-2005 





28-JAN-2005 
29-JAN-2005 
30-JAN-2005 


除了 第 一 行 ， 其 他 每 一 行 的 PROJ. START 应 该 等 于 前 一 行 的 PROJ_END (“前 一 行 ”的 定义 是 


其 PR0I_ID 等 于 当前 行 的 PROJ ID 减 1)。 仔 细 查 看 视 





Kl v 的 前 5 行 ，PRO]_ID 分 别 等 于 1 


到 3 的 行 属于 同一 “组 ”， 因 为 每 一 行 的 PR0I_END 都 等 于 后 一 行 的 PR0]_START。 我 们 希望 
找 出 一 系列 连续 项 目的 日 期 区 间 ， 因 此 希望 返回 满足 “当前 行 的 PR0]_END 等 于 下 一 行 的 


PR0J_START” 这 一 条 件 的 所 有 行 。 如 果 整 个 结果 集 只 包含 前 5 行 ， 那 么 我 们 希望 返回 的 只 

















是 最 前 面 的 3 行 。( 对 于 视图 V 全 部 14 行 数据 而 言 ) 最 终 的 结果 集 应 该 如 下 所 示 。 











PROJ_ID PROJ_START 
1 01-JAN-2005 
2 02-JAN-2005 
3 03-JAN-2005 
6 16-JAN-2005 
7 17-JAN-2005 
8 18-JAN-2005 
11 26-JAN-2005 
12 27-JAN-2005 
13 28-JAN-2005 











PROJ, END 

02-JAN-2005 
03-JAN-2005 
04-JAN-2005 
17-JAN- 2005 
18-JAN- 2005 
19- JAN- 2005 
27-JAN-2005 
28- JAN-2005 
29-JAN-2005 











我 们 从 结果 集中 剔除 掉 了 PROJ ID Z) 4, 5, 9. 10 和 14 的 行 ， 因 为 这 些 行 的 PROJ_END 不 


等 于 下 一 行 的 PROJ_START 
2. 解决 方案 


° 








DB2, MySQL, PostgreSQL 和 SQL Server 
使 用 自 连 接 找 出 包含 连续 值 的 行 。 

















select v1.proj id, 


v1.proj start, 


from V v1, V v2 


1 
2 
3 v1.proj end 
4 
5 


where v1.proj end = v2.proj start 


Oracle 


上 述 解 决 方案 也 适用 于 Oracle。 除 此 之 外 ，Oracle 还 有 另 一 个 解决 方案 ， 即 利 月 








LEAD OVER 去 查看 “下 一 行 ”的 BEGIN_DATE， 这 样 就 不 必 自 连接 了 。 


1 select proj id,proj start,proj end 


2 from ( 


3 select proj id,proj start,proj end, 


4 
5 from V 
6 ) 
7 


where next proj start - proj end 


3. 讨论 


lead(proj start)over(order by proj id) next proj start 


DB2, MySQL, PostgreSQL 和 SQL Server 














窗口 函数 


通过 视图 V 的 自 连接 ， 每 一 行 都 可 以 与 其 他 行进 行 比较 。 考 虑 查询 PROJ 1D 为 1 和 4 时 得 
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到 的 部 分 结果 集 。 


select v1.proj_id 


as v1 id, 


V1.proj end as vi end, 


v2.proj start as v2 begin, 


v2.proj. id 
from v v1, v v2 
where v1.proj. id 


as v2 id 
in ( 1,4) 


V2. BEGIN 


02- JAN-2005 
02- JAN-2005 
02- JAN-2005 
02- JAN-2005 
02- JAN-2005 
02- JAN-2005 
02- JAN-2005 
02- JAN-2005 
02- JAN-2005 
02- JAN-2005 
02- JAN-2005 
02- JAN-2005 
02- JAN-2005 
02- JAN-2005 
05- JAN-2005 
05- JAN-2005 
05- JAN-2005 
05- JAN-2005 
05- JAN-2005 
05- JAN-2005 
05- JAN-2005 
05- JAN-2005 
05- JAN-2005 
05- JAN-2005 
05- JAN-2005 
05- JAN-2005 
05- JAN-2005 
05- JAN-2005 


J& qd& ds ds d& 4& PEP PE 48 d& 48 d& d& ks ki RS RA Ra ij A | (A A iS (A | (A 


仔细 检查 以 上 结果 集 ， 我 们 就 会 明白 为 什么 PR0J_ID 1 被 包含 在 最 


01-JAN-2005 
02-JAN-2005 
03-JAN-2005 
04- JAN-2005 
06- JAN-2005 
16-JAN-2005 
17-JAN-2005 
18-JAN- 2005 
19-JAN- 2005 
21-JAN-2005 
26- JAN-2005 
27-JAN-2005 
28- JAN-2005 
29- JAN-2005 
01-JAN-2005 
02- JAN-2005 
03- JAN-2005 
04- JAN-2005 
06- JAN-2005 
16-JAN-2005 
17-JAN-2005 
18-JAN-2005 
19-JAN- 2005 
21-JAN-2005 
26-JAN-2005 
27-JAN-2005 
28- JAN-2005 
29- JAN-2005 


NO OO —+I O n + Q N P 


EA pa pa på x 
APUNE O 


OON ON n + Q N P 


10 























=H 


+: 集中， 而 PR0J_ 


ID4 却 没 有 。 这 是 因为 对 于 V1_ID 4 而 言 ， 不 存在 与 Vi END 值 相等 的 V2_BEGIN。 
如 果 改 变 一 下 第 选 条 件 ，PR0J_ID 4 也 可 以 被 认为 是 相 邻 的 项 目 。 考 虑 如 下 所 示 的 结果 集 。 





select * 
from V 














where proj id <= 5 


PROJ, ID PROJ, START 


02-JAN-2005 
03- JAN-2005 
04- JAN-2005 
05- JAN-2005 
07-JAN-2005 


1 01-JAN-2005 
2 02-JAN-2005 
3 03-JAN-2005 
4 04-JAN-2005 
5 06-JAN-2005 























如 果 “ 相 邻 的 项 目 ” 是 指 其 开始 日 期 与 另 一 个 项 目的 结束 日 期 相同 ， 那 么 PROS ID 4 也 应 
该 被 包含 在 结果 集 里 。 按 照 最 初 的 筛选 条 件 ， 由 于 前 向 比较 (比较 PR0IJ_END 和 下 一 行 的 
PROJ START) 的 存在 ，PR0IJ_ID 4 被 排除 在 外 了 ， 但 如 果 做 后 向 比较 (比较 PROJ. START 和 前 
一 行 的 PR0J_END)， 那 么 PROJ, ID 4 就 应 该 被 包含 在 结果 集中 。 


不 妨 修改 一 下 上 述 解 决 方案 ， 把 PROS ID 4 也 包含 进去 : 只 需 增 加 一 个 筛选 条 件 ， 确 保 
PROJ START 和 PROJ_END 的 相 邻 关系 都 被 纳入 检查 范围 就 行 了 ， 而 不 是 仅仅 检查 PROJ, END, 
下 面 的 查询 展示 了 上 述 改动 ， 该 查询 产生 了 一 个 包含 PR0]_ID 4 的 结果 集 (DISTINCT 是 必 
要 的 ， 因 为 一 些 行 同时 满足 两 个 条 件 )。 


select distinct 
v1.proj_id, 
v1.proj_start, 
v1.proj_end 
from V v1, V v2 
where vi.proj. end 
or vi.proj start 



































7 














v2.proj_start 
v2.proj_end 


PROJ ID PROJ START PROJ_END 

1-JAN-2005 02-JAN-2005 
2-JAN-2005 03-JAN-2005 
3-JAN-2005 04-JAN-2005 
4-JAN-2005 05-JAN-2005 


上 N P> 
OOOO 


Oracle 

上 述 自 连接 方案 当然 适用 于 本 问题 ， 不 过 窗口 函数 LEAD. OVER 用 于 解决 这 一 类 问题 更 合适 。 
LEAD OVER 函数 可 以 不 执行 自 连 接 就 能 查看 其 他 行 的 数据 (尽管 该 函数 要 求 必须 对 结果 集 进 
行 排序 )。 对 于 PROJ_ID1 和 PROJ ID4, HEARE (第 3 ~5 行 ) 的 结果 集 。 























select * 
from ( 
select proj id,proj start,proj end, 
lead(proj start)over(order by proj id) next proj start 
from v 


) 
where proj id in ( 1,4 ) 


PROJ ID PROJ START  PROJ END NEXT. PROJ, START 


1-JAN-2005 02-JAN-2005 02-JAN-2005 
4-JAN-2005 05-JAN-2005 06-JAN-2005 


仔细 检查 上 面 的 代码 片段 及 其 结果 集 ， 不 难 理解 为 什么 PROJ, ID 4 会 被 从 最 终结 果 集 里 排 
除 掉 。 这 是 因为 PROJ END 的 日 期 2005 年 1 月 5 日 与 下 一 个 项 目的 开始 日 期 2005 年 1 月 6 
日 不 同 。 

LEAD OVER 函数 用 于 解决 这 一 类 问题 非常 方便 ， 尤 其 在 只 遍历 部 分 结果 的 时 候 。 使 用 窗口 函 
数 时 ， 要 记得 它们 在 FROM 和 WHERE 子 句 之 后 才 会 被 评估 ， 因 此 前 面 的 查询 里 的 LEAD OVER 
函数 必须 被 放 入 一 个 内 和 内 视图 才 行 。 否 则 ，LEAD OVER 国 数 的 作用 对 象 就 变 成 了 只 含有 
PROJ ID 1 和 PROJ, ID 4 的 结果 集 ， 因 为 执行 过 WHERE 子 句 之 后 ， 其 他 行 都 会 被 过 滤 掉 。 
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现在 ， 如 果 改 变 一 下 筛选 条 件 ， 我 们 也 能 把 PROJ ID 4 纳入 最 终 的 结果 集 。 考 虑 视图 Vv 的 
前 5 行 数据 。 
select * 


from V 
where proj id <= 5 





PROJ, ID PROJ, START  PROJ END 
1 01-JAN-2005 02-JAN-2005 
2 02-JAN-2005 03-JAN-2005 
3 03-JAN-2005 04-JAN-2005 
4 04-JAN-2005 05-JAN-2005 
5 06-JAN-2005 07-JAN-2005 





如 果 我 们 认为 PROJ. ID 4 事实 上 是 相 邻 的 (因为 PR0]_ID 4 的 PROJ. START 等 于 PROJ. ID 3 的 
PROJ END), ， 而 且 只 有 PR0I_ID 5 应 该 被 排除 在 外 ， 那 么 前 述 解 决 方案 就 不 正确 了 ， 至 少 是 
不 全 面 的 。 


select proj id,proj start,proj end 
from ( 
select proj id,proj start,proj end, 
lead(proj start)over(order by proj id) next start 
from V 
where proj id «- 5 
) 


where proj end = next start 





PROJ, ID PROJ, START PROJ END 

1-JAN-2005 02-JAN-2005 
2-JAN-2005 03-JAN-2005 
3-JAN-2005 04-JAN-2005 


如 果 我 们 认为 PROJ. ID 4 应 该 被 包含 进来 ， 只 需 额外 加 上 LAG OVER 函数 ， 并 在 WHERE 子 名 
中 也 增加 一 个 过 滤 条 件 即 可 。 


select proj id,proj start,proj end 
from ( 
select proj id,proj start,proj end, 
lead(proj. start)over(order by proj id) next start, 
lag(proj. end)over(order by proj id) last end 
from V 
where proj id «- 5 
) 
where proj end next start 
or proj start - last end 


Q N HG 
coo 





PROJ, ID PROJ, START PROJ END 

1-JAN-2005 02-JAN-2005 
2-JAN-2005 03-JAN-2005 
3-JAN-2005 04-JAN-2005 
4-JAN-2005 05-JAN-2005 


OOOO 








这 样 一 来 ，PR0]_ID 4 也 被 纳入 最 终结 果 集 了 ， 只 有 PROJ. ID 5 会 被 排除 在 外 。 当 然 ， 如 果 
真 的 要 对 本 解决 方案 做 出 上 述 代 码 改动 ， 一 定 仔 细 确 认 需 求 。 


10.2 计算 同一 组 或 分 区 的 行 之 间 的 差 


1. 问题 

你 想 返 回 每 个 员工 的 DEPTNO, ENAME 和 SAL， 以 及 同一 个 部 门 〈 即 DEPTNO 相同 ) 里 不 同 员 
工 之 间 的 工资 差距 。 工 资 差 距 指 的 是 当前 员工 的 SAL 和 入 职 日 期 紧 随 其 后 的 那个 员工 的 
SAL 之 间 的 差 值 〈 甚 实 你 希望 以 部 门 为 单位 考察 资历 和 工资 是 否 存在 相关 性 ) 。 对 于 一 个 部 
门 里 入 职 日 期 最 晚 的 那个 员工 ， 将 其 工资 差距 设置 为 N/A。 最 终结 果 集 应 该 如 下 所 示 。 















































DEPTNO ENAME SAL HIREDATE DIFF 
10 CLARK 2450 09-JUN-1981 2550 
10 KING 5000 17-NOV-1981 3700 
10 MILLER 1300 23-JAN-1982 N/A 
20 SMITH 800 17-DEC-1980 2175 
20 JONES 2975 02-APR-1981 25 
20 FORD 3000 03-DEC-1981 0 
20 SCOTT 3000 09-DEC-1982 1900 
20 ADAMS 1100 12-JAN-1983 N/A 
30 ALLEN 1600 20-FEB-1981 350 
30 WARD 1250 22-FEB-1981 1600 
30 BLAKE 2850 01-MAY-1981 1350 
30 TURNER 1500 08-SEP-1981 250 
30 MARTIN 1250 28-SEP-1981 300 
30 JAMES 950 03-DEC-1981 N/A 
2. 解决 方案 


这 是 说 明 Oracle 窗口 函数 LEAD OVER 和 LAG OVER 的 便利 性 的 另 一 个 例子 。 不 需要 做 额外 的 
连接 查询 ， 我 们 就 能 方便 地 查看 下 一 行 或 者 前 一 行 数据 。 对 于 其 他 关系 数据 库 管 理 系统 ， 
可 以 使 用 标量 子 查询 ， 尽 管 不 是 那么 便利 。 对 于 本 问题 而 言 ， 当 被 迫 要 用 标量 子 查 询 或 自 
连接 来 解决 问题 时 ， 解 决 方案 就 没有 那么 简单 。 

DB2, MySQL, PostgreSQL 和 SQL Server 

用 标量 子 查询 取出 紧 随 当前 员工 之 后 入 职 的 员工 的 HIREDATE， 然 后 再 用 另 一 个 标量 子 查询 
找 出 该 员工 的 工资 。 


1 select deptno,ename,hiredate,sal, 
coalesce(cast(sal-next_sal as char(10)),'N/A') as diff 























3 from ( 

4 select e.deptno, 

5 e.ename, 

6 e.hiredate, 

7 e.sal, 

8 (select min(sal) from emp d 

9 where d.deptnoze.deptno 

10 and d.hiredate - 

11 (select min(hiredate) from emp d 
12 where e.deptno-d.deptno 
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13 

14 from emp e 

15 ) x 
Oracle 


and d.hiredate > e.hiredate)) as next_sal 


使 用 窗口 函数 LEAD OVER 读 取 与 当前 行 相关 的 下 一 个 员工 的 工资 。 


select deptno,ename,sal,hiredate, 
lpad(nvl(to_char(sal-next_sal),'N/A'),10) diff 


from ( 


select deptno,ename,sal,hiredate, 


from emp 


) 
3. 讨论 


order by hiredate) next_sal 


1 
2 
3 
4 
5 lead(sal)over(partition by deptno 
6 
7 
8 


DB2、MySQL、PostgreSQL 和 SQL Server 


首先 使 用 标量 子 查询 找 出 同一 个 部 门 上 
方案 在 标量 子 查询 中 使 用 了 MINCHIREDATE) 来 确保 仅 返 
不 止 一 个 人 ， 也 只 会 返回 一 个 值 。 





select e.deptno, 
e.ename, 
e.hiredate, 
e.sal, 























(select min(hiredate) from emp d 
where e.deptno-d.deptno 
and d.hiredate » e.hiredate) as next hire 


from emp e 
order by 1 


DEPTNO ENAME 


HIREDATE 


SAL NEXT HIRE 


10 KING 

10 MILLER 
20 SMITH 
20 ADAMS 
20 FORD 

20 SCOTT 
20 JONES 
30 ALLEN 
30 BLAKE 
30 MARTIN 
30 JAMES 
30 TURNER 
30 WARD 


然后 ， 使 用 另 一 个 标量 子 查询 来 找 日 


09-JUN-1981 
17-N0V-1981 
23-JAN-1982 
17-DEC-1980 
12-JAN-1983 
03-DEC-1981 
09-DEC-1982 
02-APR-1981 
20-FEB-1981 
01-MAY-1981 
28-SEP-1981 
03-DEC-1981 
08-SEP-1981 
22-FEB-1981 


2450 17-NOV-1981 
5000 23-JAN-1982 


800 02-APR-1981 


3000 09-DEC-1982 
3000 12-JAN-1983 
2975 03-DEC-1981 
1600 22-FEB-1981 
2850 08-SEP-1981 
1250 03-DEC-1981 


1500 28-SEP-1981 
1250 01-MAY-1981 





上 入职 日 期 等 于 NEXT. HIRE 的 员工 的 工资 。 同 样 ， 





决 方案 使 用 MIN 函数 来 确保 只 返回 一 个 值 。 


且 紧 随 当 前 员工 之 后 入 职 的 员工 的 HIREDATE， 本 解决 
回 一 个 值 ， 即 使 同一 天 入 职 的 员工 


本 解 





select 


from 
order 


DEPTNO 


e.deptno, 
e.ename, 
e.hiredate, 
e.sal, 
(select min(sal) from emp d 
where d.deptno-ze.deptno 
and d.hiredate - 
(select min(hiredate) from emp d 
where e.deptno-d.deptno 
and d.hiredate » e.hiredate)) as next sal 


emp e 
by 1 

ENAME HIREDATE SAL NEXT. SAL 
CLARK 09- JUN- 1981 2450 5000 
KING 17-NOV-1981 5000 1300 
MILLER 23-JAN-1982 1300 

SMITH 17-DEC-1980 800 2975 
ADAMS 12-JAN-1983 1100 

FORD 03-DEC-1981 3000 3000 
SCOTT 09-DEC-1982 3000 1100 
JONES 02-APR-1981 2975 3000 
ALLEN 20-FEB-1981 1600 1250 
BLAKE 01-MAY-1981 2850 1500 
MARTIN 28-SEP-1981 1250 950 
JAMES 03-DEC-1981 950 

TURNER 08-SEP-1981 1500 1250 
WARD 22-FEB-1981 1250 2850 





最 后 ， 计 算出 SAL 和 NEXT. SAL 之 间 的 差 ， 并 且 使 用 COALESCE 函数 在 适当 的 时 候 返 回 N/A, 
因为 减法 运算 的 结果 既 有 可 能 是 数字 ， 也 有 可 能 是 NtL， 所 以 必须 将 其 转换 为 字符 串 ， 以 
fi COALESCE 函数 可 以 正常 运行 。 


select 


from 
select 


from 


order 


DEPTNO 





























deptno,ename,hiredate,sal, 
coalesce(cast(sal-next sal as char(10)),'N/A') as diff 
( 
e.deptno, 
e.ename, 
e.hiredate, 
e.sal, 
(select min(sal) from emp d 

where d.deptnoze.deptno 

and d.hiredate - 
(select min(hiredate) from emp d 
where e.deptno-d.deptno 
and d.hiredate » e.hiredate)) as next sal 


emp e 

)x 

by 1 

ENAME HIREDATE SAL DIFF 
CLARK 09- JUN- 1981 2450 -2550 
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10 
10 
20 
20 
20 
20 
20 
30 
30 
30 
30 
30 
30 


oa 











Oracle 


首先 使 用 窗口 函数 LEAD OVER 为 每 个 员工 找 
门 里 最 迟 入 职 的 员工 ， 翰 


select 


from 


DEPTNO 





KING 17-NOV-1981 
MILLER 23-JAN-1982 
SMITH 17-DEC-1980 
ADAMS 12-JAN-1983 
FORD 03-DEC-1981 
SCOTT 09-DEC-1982 
JONES 02-APR-1981 
ALLEN 20-FEB-1981 
BLAKE 01-MAY-1981 
MARTIN 28-SEP-1981 
JAMES 03-DEC-1981 
TURNER 08-SEP-1981 
WARD 22-FEB-1981 

本 解决 方案 使 用 了 MIN 


5000 
1300 

800 
1100 
3000 
3000 
2975 
1600 
2850 
1250 

950 
1500 
1250 


(SAL) 国 数 ， 


3700 
N/A 
-2175 
N/A 

0 
1900 
-25 
350 
1350 
300 
N/A 
250 
-1600 


这 说 明 我 们 在 某 些 情况 下 可 能 会 不 知 不 觉 


间 把 一 些 额 外 的 业务 逻辑 引入 查询 ， 而 我 们 却 认 为 这 只 是 一 个 纯粹 的 技术 决 


择 权 交 给 提 H 




















deptno,ename,sal,hiredate, 
lead(sal)over(partition by deptno order by hiredate) next sal 


emp 


ENAME 


KING 
MILLER 
SMITH 
JONES 
FORD 
SCOTT 
ADAMS 
ALLEN 
WARD 
BLAKE 
TURNER 
MARTIN 
JAMES 





然后 ， 计 算出 同 


from 


( 


HIREDATE 


09-JUN-1981 
17-NOV-1981 
23- JAN- 1982 
17-DEC-1980 
02-APR-1981 
03-DEC-1981 
09-DEC-1982 
12-JAN- 1983 
20-FEB-1981 
22-FEB-1981 
01-MAY-1981 
08-SEP-1981 
28-SEP-1981 
03-DEC-1981 


Š 策 。 如 果 一 个 给 定 的 日 期 对 应 多 个 可 能 的 
大 值 还 是 平均 值 呢 ? 本 例 选 择 了 最 小 值 。 在 实际 工作 
报表 请 求 的 客户 。 








NEXT. SAL 


[ 资 值 ， 我 们 应 该 选择 最 小 值 、 最 





bP， 我 可 能 更 愿意 将 选 


时 同 部 门 中 的 “下 一 个 ”工资 值 。 对 于 每 个 部 
E NEXT. SAL 列 会 是 Null, 


个 部 门 里 每 个 员工 与 紧 随 其 后 人 职 的 员工 的 工资 差 值 。 


select deptno,ename,sal,hiredate, sal-next sal diff 


select deptno,ename,sal,hiredate, 
lead(sal)over(partition by deptno order by hiredate) next sal 


from 


emp 





DEPTNO ENAME 


SAL HIREDATE 


10 KING 

10 MILLER 
20 SMITH 
20 JONES 
20 FORD 

20 SCOTT 
20 ADAMS 
30 ALLEN 
30 WARD 

30 BLAKE 
30 TURNER 
30 MARTIN 
30 JAMES 


2450 09-JUN-1981 
5000 17-NOV-1981 
1300 23-JAN-1982 
800 17-DEC-1980 
2975 02-APR-1981 
3000 03-DEC-1981 
3000 09-DEC-1982 
1100 12-JAN-1983 
1600 20-FEB-1981 
1250 22-FEB-1981 
2850 01-MAY-1981 
1500 08-SEP-1981 
1250 28-SEP-1981 
950 03-DEC-1981 


接 下 来 ， 调 用 NVL 函数 ， 在 DIFF 等 于 NuLL 时 返回 N/A。 为 了 做 到 这 一 点 ， 必 须 先 把 DIFF 
值 转换 为 字符 串 ， 否 则 NVL 函数 会 执行 失败 。 





select deptno,ename,sal 


,hiredate, 


nvl(to  char(sal-next sal),'N/A') diff 


from ( 
select deptno,ename,sal 
lead(sal)over(pa 
from emp 


DEPTNO ENAME 


;hiredate, 
rtition by deptno 


SAL HIREDATE 


order by hiredate) next sal 


10 MILLER 
20 SMITH 
20 JONES 
20 FORD 

20 SCOTT 
20 ADAMS 
30 ALLEN 
30 WARD 

30 BLAKE 
30 TURNER 
30 MARTIN 
30 JAMES 





最 后 ， 调 用 函数 LPAD 对 DIFF 值 进行 格式 化 。 这 是 


而 字符 串 则 是 左 对 齐 的 。 调 月 


select deptno,ename,sal 


2450 09-JUN-1981 
5000 17-NOV-1981 
1300 23-JAN-1982 
800 17-DEC-1980 
2975 02-APR-1981 
3000 03-DEC-1981 
3000 09-DEC-1982 
1100 12-JAN-1983 
1600 20-FEB-1981 
1250 22-FEB-1981 
2850 01-MAY-1981 
1500 08-SEP-1981 
1250 28-SEP-1981 
950 03-DEC-1981 





,hiredate, 





>H 








为 在 默认 情况 下 ， 数 字 是 右 对 齐 的 ， 




















H LPAD 能 让 所 有 结果 值 都 变 成 右 对 齐 。 


lpad(nvl(to_char(sal-next_sal),'N/A'),10) diff 


from ( 
select deptno,ename,sal 


,hiredate, 


lead(sal)over(partition by deptno order by hiredate) next_sal 
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from emp 


) 


DEPTNO ENAME 


10 MILLER 
20 SMITH 
20 JONES 
20 FORD 

20 SCOTT 
20 ADAMS 
30 ALLEN 
30 WARD 

30 BLAKE 
30 TURNER 
30 MARTIN 
30 JAMES 


SAL HIREDATE DIFF 


2450 09-JUN-1981 -2550 
5000 17-NOV-1981 3700 
1300 23-JAN-1982 N/A 
800 17-DEC-1980 -2175 
2975 02-APR-1981 -25 
3000 03-DEC-1981 0 
3000 09-DEC-1982 1900 
1100 12-JAN-1983 N/A 
1600 20-FEB-1981 350 
1250 22-FEB-1981 -1600 
2850 01-MAY-1981 1350 
1500 08-SEP-1981 250 
1250 28-SEP-1981 300 
950 03-DEC-1981 N/A 


本 书 的 大 部 分 实例 都 没有 讨论 “特例 ”( 这 是 考虑 到 代码 的 可 读 性 ， 也 有 利于 我 在 写作 过 
程 中 保持 思路 清晰 ) ， 但 是 本 例 有 必要 讨论 一 下 在 使 用 Oracle 的 LEAD OVER 函数 时 需要 注意 
的 重复 项 问题 。 对 于 EMP 表 里 那 些 简单 的 示例 数据 而 言 ， 并 不 存在 HIREDATE 相同 的 行 ， 这 
也 是 非常 可 能 发 生 的 状况 。 因 而 ， 正 常情 况 下 ， 我 不 会 讨论 如 数据 重复 之 类 的 特例 (因为 
EMP 表 里 并 没有 重复 项 )。 但 是 ,一 旦 涉及 LEAD 函数 ， 有 些 读者 很 可 能 无 法 马上 想到 这 一 























E (对 于 那些 没有 Oracle 经 验 的 读者 尤其 如 此 )。 考 虑 如 下 所 示 的 查询 ， 该 查询 返 


编号 为 10 的 员工 之 间 的 工资 差距 (按照 入 职 先后 排序 计算 4 























select deptno,ename,sal,hiredate, 


lpad(nvl(to, char(sal-next sal), 'N/A'),10) diff 


from ( 


select deptno,ename,sal,hiredate, 
lead(sal)over(partition by deptno 


from emp 


order by hiredate) next sal 


where deptno-10 and empno » 10 


) 


DEPTNO ENAME 
10 CLARK 
10 KING 
10 MILLER 


SAL HIREDATE DIFF 


2450 09-JUN-1981 -2550 
5000 17-NOV-1981 3700 
1300 23-JAN-1982 N/A 

















前 后 两 人 的 工资 差 什 














)。 





回 部 门 


上 述 解 决 方 案 对 于 EM 表 的 现 有 数据 而 言 训 无 问题 ， 但 如 果 考 虑 重复 行 ， 就 不 对 了 。 考 虑 
如 下 所 示 的 例子 ， 有 另外 4 人 和 员工 KING 同一 天 入 职 。 


insert into emp (empno,ename,deptno,sal,hiredate) 
values (1,'ant',10,1000,to date('17-NOV-1981')) 


insert into emp (empno,ename,deptno,sal,hiredate) 
values (2,'joe',10,1500,to date('17-NOV-1981')) 





insert 
values 


insert 
values 


select 
from 


select 


from 
where 


DEPTNO 


into emp (empno,ename,deptno,sal,hiredate) 
(3, ' jin',10,1600,to date('17-NOV-1981')) 


into emp (empno,ename,deptno,sal,hiredate) 
(4, ' jon',10,1700,to. date('17-NOV-1981')) 


deptno,ename, sal,hiredate, 
lpad(nvl(to, char(sal-next sal),'N/A'),10) diff 
( 
deptno,ename, sal,hiredate, 
lead(sal)over(partition by deptno 

order by hiredate) next, sal 


emp 

deptno-10 

) 

ENAME SAL HIREDATE DIFF 

CLARK 2450 09-JUN-1981 1450 
ant 1000 17-NOV-1981 -500 
joe 1500 17-NOV-1981 -3500 
KING 5000 17-NOV-1981 3400 
jim 1600 17-NOV-1981 -100 
jon 1700 17-NOV-1981 400 
MILLER 1300 23-JAN-1982 N/A 





我 们 看 到 ， 除 了 JON 以 外 ， 其 他 在 同一 天 (11 H 17 H) 入 职 的 员工 竟然 都 在 和 另 一 个 同 
时 入 职 的 人 做 工资 比较 ! 这 是 不 正确 的 。 所 有 在 11 H 17 日 人 职 的 员工 都 应 该 和 MILLER 
做 比较 。 以 员工 ANT 为 例 ，ANT 的 DIFF 值 是 -300， 这 是 因为 其 SAL 值 相 较 于 JOE 少 
500。 事 实 上 ，ANT 的 DIFF 值 应 该 是 -300 才 对 ， 因 为 其 SAL 值 比 MILLER 的 少 300， 依 





据 HIREDATE 的 顺序 ，MILLER 才 是 紧 随 ANT 之 后 
归 因 于 LEAD OVER 函数 的 默认 行为 方式 。 在 默认 情况 下 ，LEAD OVER 函数 只 往 
此 ， 对 于 员工 ANT 而 言 ， 基 于 HIREDATE 的 下 一 个 SAL 值 是 JOE 的 SAL， 因 为 LEAD OVER Ë 
数 只 会 看 下 一 m ` o WAWE, Oracle 考虑 到 了 这 种 情况 ， 并 允许 我 们 
告诉 LEAD OVER 函数 应 该 往 前 看 儿 行 。 对 于 本 例 而 言 ， 只 需要 做 

















通过 传递 一 


个 额 

































































前 看 一 行 。 


入 职 的 员工 。 上 述 查 询 结 果 的 错误 应 该 








PR 





一 个 计数 : nue us 11 H 17 odi 1H23H (MILLER 的 HIREDATE) 之 
间 的 距离 。 下 面 的 解决 方案 展示 了 如 何 实现 这 一 点 。 





select 
from 


select 


from 
select 


from 
where 


deptno,ename, sal,hiredate, 

lpad(nvl(to_char(sal-next_sal),'N/A'),10) diff 

( 

deptno,ename, sal,hiredate, 

lead(sal,cnt-rn+1)over(partition by deptno 
order by hiredate) next_sal 

( 

deptno,ename, sal ,hiredate, 

count(*)over(partition by deptno,hiredate) cnt, 

row_number()over(partition by deptno,hiredate order by sal) rn 

emp 

deptno=10 

) 
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DEPTNO ENAME SAL 


10 CLARK 2450 
10 ant 1000 
10 joe 1500 
10 jim 1600 
10 jon 1700 


10 KING 5000 
10 MILLER 1300 





HIREDATE DIFF 


09- JUN- 1981 1450 
17-NOV-1981 -300 
17-NOV-1981 200 
17-NOV-1981 300 
17-NOV-1981 400 


17-NOV-1981 3700 
23-JAN- 1982 N/A 


现在 的 解决 方案 是 正确 的 了 。 我 们 看 到 ， 所 有 在 11 月 17 日 人 职 的 员工 都 改 为 和 MILLER 
做 比较 了 。 从 查询 结果 里 可 以 看 到 ， 现 在 员工 ANT 的 DIFF 值 是 -300， 这 正 是 我 们 希望 的 
结果 。 你 可 能 不 理解 传递 给 LEAD OVER 的 表达 式 ， 其 实 ，CNT-RN+1 代表 每 一 个 在 11 月 17 
日 人 职 的 员工 到 MILLER 的 距离 。 如 下 所 示 的 内 艇 视图 展示 了 CNT 和 RN 的 值 。 








select deptno,ename， 








sal,hiredate, 


count(*)over(partition by deptno,hiredate) cnt, 
row number()over(partition by deptno,hiredate order by sal) rn 


from emp 
where deptno-10 


DEPTNO ENAME SAL 
10 CLARK 2450 
10 ant 1000 
10 joe 1500 
10 jim 1600 
10 jon 1700 
10 KING 5000 
10 MILLER 1300 


HIREDATE CNT RN 
09-JUN-1981 1 1 
17-NOV-1981 5 1 
17-NOV-1981 5 2 
17-NOV-1981 5 3 
17-NOV-1981 5 4 
17-NOV-1981 5 5 
23-JAN- 1982 1 1 











对 于 每 一 个 员工 而 言 ，CNT 值 表示 有 多 少 个 相同 的 HIREDATE, RN 值 代表 的 是 部 门 编号 为 10 























的 员工 的 排名 。 排 名 基于 DEPTNO 和 HIREDATE 分 组 ， 因 此 只 有 在 HIREDATE 重复 的 时 候 ， 员 
工 的 排名 才 可 能 大 于 1。 排 名 基于 SAL 值 排序 (并 不 是 必须 这 么 做 ， 只 是 基于 SAL 值 排序 
比较 方便 ， 当 然 也 可 以 选 EMPN0)。 现 在 我 们 知道 了 有 多 少 个 重复 项 ， 以 及 每 一 个 重复 项 
对 应 的 排名 ， 它 们 到 MILLER 的 距离 就 是 重复 项 的 数目 减 去 当前 排名 ， 然 后 再 加 1 (cNT- 
RN+1) 。 距 离 计算 的 结果 以 及 它 对 LEAD OVER 的 效果 显示 如 下 。 





select deptno,ename， 


























sal,hiredate, 


lead(sal)over(partition by deptno 


order by hiredate) incorrect, 


cnt-rn«1 distance, 


lead(sal,cnt- 


from ( 


rn*i)over(partition by deptno 
order by hiredate) correct 


select deptno,ename,sal,hiredate, 
count(*)over(partition by deptno,hiredate) cnt, 
row number()over(partition by deptno,hiredate 


from emp 
where deptno-10 


order by sal) rn 





DISTANCE CORRECT 


DEPTNO ENAME SAL 
10 CLARK 2450 
10 ant 1000 
10 joe 1500 
10 jim 1600 
10 jon 1700 


10 KING 5000 
10 MILLER 1300 


HIREDATE INCORRECT 
09-JUN-1981 1000 
17-NOV-1981 1500 
17-NOV-1981 1600 
17-NOV-1981 1700 
17-NOV-1981 5000 
17-NOV-1981 1300 
23-JAN- 1982 





现在 我 们 清楚 地 看 到 了 当 传 递 正 确 的 距离 值 给 LEAD OVER 函数 时 会 得 到 什么 样 的 结果 。 
INCORRECT 列 代表 了 传递 默认 距离 1 给 LEAD OVER 国 数 时 得 到 的 返回 值 。CORRECT 列 代 表 了 
为 每 个 重复 的 HIREDATE 对 应 的 员工 传递 到 MILLER 的 实际 值 给 LEAD OVER 函数 时 得 到 的 返 








回 值 。 至 此 ， 剩 下 要 做 的 就 是 为 每 一 行 找 











绍 过 了 。 



































H CORRECT 和 SAL 之 间 的 差 值 ， 这 在 前 面 已 经 介 














10.3 定位 连续 值 区 间 的 开始 值 和 结束 值 


1. 问题 


本 实例 是 本 章 第 一 个 实例 的 引申 ， 它 们 都 用 到 了 视图 V。 在 之 前 的 实例 中 ， 你 已 经 找到 了 
你 希望 知道 它们 的 开始 值 和 结束 值 。 与 本 章 的 第 一 个 实例 不 同 ， 
如 果 有 一 行 并 不 属于 某 个 连续 值 区 间 ， 你 仍然 希望 返回 它 。 为 什么 ?这 是 因为 ， 这 样 的 行 





包含 一 组 连续 值 的 区 间 ， 




















自 成 一 个 区 间 ， 它 也 有 自己 的 开始 值 和 结束 值 。 视 


select * 
from V 


PROJ_ID PROJ_START 
01-JAN-2005 
02-JAN-2005 
03- JAN-2005 
04- JAN-2005 
06-JAN-2005 
16-JAN-2005 
17-JAN-2005 
18-JAN-2005 
19-JAN-2005 
21-JAN-2005 
26-JAN-2005 
27 -JAN-2005 
28-JAN- 2005 
29-JAN- 2005 


B = = = 
Q N P G O OO +I O n b QÓ N P 


m 
小 








PROJ_END 

02-JAN-2005 
03-JAN-2005 
04-JAN-2005 
05-JAN-2005 
07-JAN-2005 
17-JAN-2005 
18-JAN-2005 
19-JAN-2005 
20-JAN-2005 
22-JAN-2005 
27-JAN-2005 
28-JAN-2005 
29-JAN-2005 
30-JAN-2005 





你 最 终 希 望 得 到 如 下 所 示 的 结果 集 。 





PROJ_GRP PROJ, START 


PROJ, END 


1 01-JAN-2005 05-JAN-2005 























图 v 的 数据 如 下 所 示 。 
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2 06-JAN-2005 07-JAN-2005 
3 16-JAN-2005 20-JAN-2005 
4 21-JAN-2005 22-JAN-2005 
5 26-JAN-2005 30-JAN-2005 


2. 解决 方案 


相 较 于 本 章 第 一 个 实例 ， 本 问题 更 为 复杂 。 首 先 ， 必 须 明确 什么 是 区 间 。PR0J_START 和 











PROJ, END 的 值 决 定 哪些 行 属于 同 
PROJ END 值 ， 那 么 该 行 就 是 “连续 ” 


值 不 等 于 上 一 行 的 PROJ END 值 ， 并 且 它 的 PR03_END 值 也 不 等 于 下 一 行 的 PR03_START 值 ， 





个 区 间 。 如 果 某 一 行 的 PR0I_START 值 等 于 上 一 行 的 
的 ， 或 者 说 它 属于 某 个 组 。 如 果 某 一 行 的 PR0J_START 


























那么 该 行 自身 就 构成 了 一 个 独立 的 组 。 识 别 出 区 间 之 后 ， 还 要 对 每 个 区 间 相 关 的 行进 行 分 





组 ， 并 找 出 每 一 组 的 开始 值 和 结束 值 



































° 





我 们 来 看 看 最 终结 果 集 的 第 一 行 数据 。PR0I_START 值 是 视图 V 里 PROJ. ID 1 对 应 的 PR03_ 
START, PROJ END 则 是 视图 V 里 PR0J_ID 4 对 应 的 PROJ_END, PROJ ID 4 后 面 并 没有 再 出 现 一 





个 连续 值 ， 因 此 它 作 为 这 











一 组 连续 什 
































的 最 后 一 个 被 纳入 了 第 一 组 。 


DB2, MySQL, PostgreSQL 和 SQL Server 
这 些 数据 库 对 应 的 解决 方案 需要 用 到 





create view v2 
as 
select a.*, 
case 
when ( 





select b.proj id 
from V b 
where a.proj start - b.proj end 


) 


视图 V2， 以 增强 代码 的 可 读 性 。 视 图 V2 的 定义 如 下 。 


is not null then 0 else 1 


end as flag 
from Va 


其 结果 集 如 下 所 示 。 


select * 
from V2 














PROJ_ID PROJ_START 


01-JAN-2005 
02-JAN-2005 
03-JAN-2005 
04-JAN-2005 
06-JAN-2005 
16-JAN-2005 
17-JAN-2005 
18-JAN- 2005 
19-JAN- 2005 
21-JAN-2005 
11 26-JAN-2005 
12 27-JAN-2005 


co —+ OA a + QO N P 


HB 
C o 


02-JAN-2005 
03- JAN-2005 
04- JAN-2005 
05-JAN-2005 
07-JAN-2005 
17-JAN-2005 
18-JAN-2005 
19- JAN- 2005 
20-JAN-2005 
22-JAN-2005 
27-JAN-2005 
28-JAN-2005 


@ = = @ @ @ F = @ @ @ = 





13 28 
14 29 


-JAN-2005 29-JAN-2005 0 
-JAN-2005 30-JAN-2005 0 


在 视图 v2 的 基础 上 得 到 的 解决 方案 如 下 所 示 。 首 先 ， 找 出 那些 属于 某 个 连续 值 区 间 的 行 ， 
并 为 它们 分 组 。 然 后 ， 调 用 MIN 函数 和 MAX 函数 找 出 每 一 组 的 开始 值 和 结束 值 。 


1 
2 
3 
4 
5 
6 
7 
8 
9 
0 
1 


== 


Oracle 


select 


from 
select 


from 


group 


proj_grp, 
min(proj_start) as proj_start, 
max(proj_end) as proj_end 
( 
a.proj id,a.proj start,a.proj end, 
(select sum(b.flag) 

from V2 b 

where b.proj id «- a.proj id) as proj grp 

V2 a 
)x 
by proj grp 


上 述 解决 方案 当然 也 适用 于 Oracle, xb, IB BJ Oracle 的 窗口 函数 LAG OVER， 无 须 额 外 的 
视图 也 能 解决 本 问题 。 我 们 可 以 利用 LAG OVER 函数 判定 前 一 行 的 PR0IJ_END 是 否 等 于 当前 行 
的 PR0J_START， 并 以 此 为 标准 对 当前 行进 行 分 组 。 分 组 完成 之 后 ， 接 着 调用 聚合 函数 MIN 
和 MAX 分 别 找 出 每 组 的 开始 值 和 结束 值 。 


3. 讨论 


select 
from 
select 


from 
select 


from 


group 








proj_grp, min(proj_start), max(proj_end) 
( 

proj id,proj start,proj end, 
sum(flag)over(order by proj id) proj grp 


( 

proj id,proj start,proj end, 

case when 
lag(proj end)over(order by proj id) = proj start 
then 0 else 1 

end flag 

V 

) 

) 

by proj grp 


DB2, MySQL, PostgreSQL 和 SQL Server 

V2， 本 问题 就 相对 容易 一 些 了 。 视 图 V2 在 CASE 表达 式 里 用 了 一 个 标量 子 查询 来 
行 是 否 属 于 某 个 连续 值 区 间 。 如 果 当 前 行 属 于 某 个 连续 值 区 间 ， 那 么 别名 为 FLAG 
的 CASE 表达 式 将 返回 0， 反之， 则 返回 1 (判定 当前 行 是 否 属于 一 组 连续 值 区 间 的 方法 是 : 








有 了 视图 
判断 当前 








是 否 有 一 条 记录 的 PROJ_END 值 等 于 当前 行 的 PROJ_START 值 ) 。 下 一 步 是 逐一 查看 内 舱 视 图 







































































X (第 5 ~ 9 行 ) 的 查询 结果 。 内 航 视 图 X 返回 视 图 v2 的 全 部 行 以 及 针对 FLAG 的 累计 值 ， 
该 累计 值 就 是 我 们 分 组 的 依据 ， 如 下 所 示 。 


select a.proj_id,a.proj_start,a.proj_end, 


(se 





lect sum(b.flag) 
from v2 b 
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where b.proj id <= a.proj id) as proj_grp 


from v2 a 


PROJ, ID PROJ, START 


PROJ, END 


PROJ, GRP 


01-JAN-2005 
02-JAN-2005 
03-JAN-2005 
04-JAN-2005 
06-JAN-2005 
16-JAN-2005 
17-JAN-2005 
18-JAN-2005 
19-JAN- 2005 
21-JAN-2005 
26-JAN-2005 
27-JAN-2005 
28- JAN-2005 
29- JAN-2005 


\D OO +I ON a K Q N P 


B = P P= > 
+O N PF 


02-JAN-2005 
03-JAN-2005 
04-JAN-2005 
05-JAN-2005 
07-JAN-2005 
17-JAN-2005 
18-JAN-2005 
19-JAN-2005 
20-JAN-2005 
22-JAN-2005 
27-JAN-2005 
28-JAN-2005 
29-JAN-2005 
30-JAN-2005 





现在 已 经 确定 好 各 个 区 间 了 ， 接 





UUAA QQ QQ QQ QQ N FB PF HH 


来 要 针对 PR03_START 和 PROJ. END 分 别 调用 聚合 函数 MIN 


和 MAX 找 出 每 个 区 间 的 开始 值 和 结束 值 ， 然 后 根据 上 述 累计 值 分 组 。 





Oracle 


对 于 本 实例 而 言 ， 窗 口 函 数 LAG OVER 非常 有 用 。 我 们 无 须 使 用 自 连 接 、 标 量子 查询 或 额外 
的 视图 就 能 访问 前 一 行 的 PROJ_END 值 。 去 掉 了 CASE 表达 式 的 LAG OVER 函数 的 执行 结果 显 





示 如 下 。 


select proj id,proj start,proj end, 
lag(proj end)over(order by proj id) prior proj end 


from V 


PROJ, ID PROJ, START 


PROJ, END 


PRIOR PROJ END 


01-JAN-2005 
02-JAN-2005 
03-JAN-2005 
04-JAN-2005 
06-JAN-2005 
16-JAN- 2005 
17-JAN-2005 
18-JAN-2005 
19-JAN- 2005 
21-JAN-2005 
26-JAN-2005 
27-JAN-2005 
28- JAN-2005 
29- JAN-2005 


\D OO +I O a R QQ N P 


P = pP = => 
+ Q N P ° 


02-JAN-2005 
03-JAN-2005 
04-JAN-2005 
05-JAN-2005 
07-JAN-2005 
17-JAN-2005 
18-JAN-2005 
19-JAN-2005 
20-JAN-2005 
22-JAN-2005 
27-JAN-2005 
28-JAN-2005 
29-JAN-2005 
30-JAN-2005 





02-JAN-2005 
03-JAN-2005 
04-JAN-2005 
05-JAN-2005 
07-JAN-2005 
17-JAN-2005 
18-JAN-2005 
19-JAN-2005 
20-JAN-2005 
22-JAN-2005 
27-JAN-2005 
28-JAN-2005 
29-JAN-2005 

















从 完整 的 代码 中 可 以 看 到 ，CASE 表达 式 只 是 比较 了 LAG OVER 函数 返回 的 结果 和 当前 行 的 














PROJ_START 值 ， 如 果 两 个 值 相等 ， 





则 返回 0， 否 则 返回 








l, 


下 一 步 就 是 针对 CASE 表达 式 返 


回 的 0 和 1 产生 一 个 累计 值 ， 从 而 把 每 一 行 都 编 入 某 个 组 。 上 述 累 计 值 的 计算 结果 显示 


如 下 。 








select proj id,proj start, 


proj end, 


sum(flag)over(order by proj id) proj grp 


from ( 
select proj id,proj start, 
case when 


proj end, 


lag(proj end)over(order by proj id) - proj start 


then 0 else 1 
end flag 
from V 
) 


PROJ ID PROJ START  PROJ END PROJ, GRP 


NO OO —+ OA a + Q N P 


P P. R. = = 
+N Pe 


01-JAN-2005 02-JAN-2005 
02-JAN-2005 03-JAN-2005 
03-JAN-2005 04-JAN-2005 
04-JAN-2005 05-JAN-2005 
06-JAN-2005 07-JAN-2005 
16-JAN-2005 17-JAN-2005 
17-JAN-2005 18-JAN-2005 
18-JAN-2005 19-JAN-2005 
19-JAN-2005 20-JAN-2005 
21-JAN-2005 22-JAN-2005 
26-JAN-2005 27-JAN-2005 
27-JAN-2005 28-JAN-2005 
28-JAN-2005 29-JAN-2005 
29-JAN-2005 30-JAN-2005 


UUAA QQ QQ QQ QQ N BE FF PF = 





现在 每 一 行 都 被 放 入 了 各 自 的 组 ， 只 要 针对 PR03_START 值 和 PROJ, END 值 分 别 调用 聚合 函 
数 MIN 和 MAX， 然 后 基于 PR0J_GRP 列 的 累计 值 分 组 即 可 。 


10.4 为 值 区 间 填 充 缺 失 值 











1. 问题 
你 想 列 出 整个 20 世纪 80 年 代目 
你 希望 返回 如 下 所 示 的 结果 集 。 

















1981 10 


pä 
\D 
co 
Cn 

@ @ @ @ @ @ = rN9s 


2. 解决 方案 























每 年 新 入 职 的 员工 人 数 ， 但 有 一 些 年 份 并 没有 新 增 员工 。 


本 解决 方案 的 关键 之 处 在 于 如 何 为 那些 没有 新 增 员工 的 年 份 返回 0。 如 果 在 一 个 给 定 的 年 
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份 里 没有 新 入 职 的 员工 ， 那 么 EMP 表 里 就 不 存在 对 应 的 行 。 既 然 表 里 不 包含 这 一 年 ， 我 们 
该 如 何 为 这 一 年 返回 计数 值 0 呢 ? 本 解决 方案 需要 用 到 外 连接 操作 。 我 们 要 拼凑 一 个 包含 
了 所 有 目标 年 份 的 结果 集 ， 然 后 针对 EM 表 执 行 COUNT 查询 ， 以 判断 每 一 年 里 是 否 新 增 了 


员工 。 


DB2 
































把 EMP 表 作为 数据 透视 表 (因为 它 有 14 行 数据 )， 并 调用 内 置 函数 YEAR， 为 20 世纪 80 年 
代 的 每 一 个 年 份 生成 一 行 数据 。 然 后 ， 外 连接 EMP 表 ， 并 计算 每 年 新 增 了 多 少 名 员工 。 


Oracle 


select 
from 
group 


on 








x.yr, coalesce(y.cnt,0) cnt 

( 

year(min(hiredate)over()) - 
mod(year(min(hiredate)over()),10) + 
row_number()over()-1 yr 


emp fetch first 10 rows only 

)x 

join 

year(hiredate) yri, count(*) cnt 
emp 

by year(hiredate) 

) y 

( x.yr = y.yr1 ) 





把 EMP 表 作为 数据 透视 表 〈 因 为 它 有 14 行 数据 )， 并 调用 内 置 国 数 TO. NUMBER 和 TO. CHAR, 
为 20 世纪 80 年 代 的 每 一 个 年 份 生成 一 行 数据 。 然 后 ， 外 连接 EMP 表 ， 并 计算 每 年 新 增 了 


多 少 名 员工 。 
1 select 
2 from 
3 select 
4 
5 
6 from 
7 where 
8 
9 
10 select 
11 from 
12 group 
13 
14 where 


X.yr, coalesce(cnt,0) cnt 

( 

extract(year from min(hiredate)over()) - 
mod(extract(year from min(hiredate)over()),10) + 
rownum-1 yr 

emp 

rownum «- 10 

) x, 

( 

to number(to char(hiredate,'YYYY')) yr, count(*) cnt 
emp 

by to number(to char(hiredate, 'YYYY')) 

)y 

x.yr = y.yr(*) 


如 有 果 使 用 的 是 Oracle 9; 及 后 续 版 本 ， 则 不 妨 使 用 新 提供 的 JOIN 子 句 。 


1 
2 
3 
4 
5 
6 
7 


select 
from 
select 


from 
where 


x.yr, coalesce(cnt,0) cnt 

( 

extract(year from min(hiredate)over()) - 
mod(extract(year from min(hiredate)over()),10) + 
rownum-1 yr 

emp 

rownum <= 10 





8 ) x 
9 left join 
10 ( 
11 select to number(to char(hiredate,'YYYY')) yr, count(*) cnt 
12 from emp 
13 group by to number(to char(hiredate, 'YYYY')) 
14 ) y 
15 on ( x.yr = y.yr ) 
PostgreSQL 和 MySQL 





把 T10 表 作为 数据 透视 表 (因为 它 有 10 行 数据 )， 并 调用 内 置 函数 EXTRACT, 23 20 世纪 80 
年 代 的 每 一 个 年 份 生成 一 行 数据 。 然 后 ， 外 连接 EMP 表 ， 并 计算 每 年 新 增 了 多 少 名 员工 。 


select 
from 
select 
from 
select 


from 


left 
select 
from 


group 


on 


SQL Server 
把 EMP 表 作 为 数据 透视 表 (因为 它 有 14 行 数 据 )， 并 调用 内 置 函 数 YEAR, 220 世纪 80 年 
代 的 每 一 个 年 份 生成 一 行 数据 。 然 后 ， 外 连接 EMP 表 ， 并 计算 每 年 新 增 了 多 少 名 员工 。 


1 
2 
3 
4 
5 
6 
7 
8 


Ko) 


3. 讨论 


select 
from 
select 


select 
from 
group 


on 














y.yr, coalesce(x.cnt,0) as cn 
( 
min year-mod(cast(min year as int),10)+rn as yr 
( 
(select min(extract(year from hiredate)) 
from emp) as min year, 
id-1 as rn 
t10 
)a 
)y 
join 
( 
extract(year from hiredate) as yr, count(*) as cnt 
emp 
by extract(year from hiredate) 
)x 
C y.yr = x.yr ) 


x.yr, coalesce(y.cnt,0) cnt 

( 

top (10) 
(year(min(hiredate)over()) - 
year(min(hiredate)over( ))910)-4 
row number()over(order by hiredate)-1 yr 

emp 

) x 

join 

( 

year(hiredate) yr, count(*) cnt 

emp 

by year(hiredate) 

) y 

( x.yr = y.yr ) 


Ju ra PERO STEYR S RAMD, MAAS. ARIE x 先 找 出 最 早 
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的 HIREDATE 值 对 应 的 年 份 ， 进 而 返回 20 世纪 80 年 代 的 每 一 年 。 下 一 步 是 用 最 早 的 年 份 
减 去 该 年 份 模 10 计算 的 结果 ， 然 后 再 加 上 RN-1。 为 了 更 清楚 地 了 解 其 工作 原理 ， 我 们 不 
妨 实 际 和 运行 一 下 内 内 视 图 X， 并 分 别 返 回 其 中 涉及 的 每 一 个 值 。 下 面 列 出 了 两 个 版 本 的 内 
藤 视 图 X， 它 们 分 别 使 用 窗口 国 数 MIN OVER (DB2, Oracle 和 SQL Server) 和 标量 子 查询 
(MySQL 和 PostgreSQL) 来 得 到 对 应 的 结果 集 。 


select year(min(hiredate)over()) - 
mod(year(min(hiredate)over()),10) + 
row_number()over()-1 yr, 
year(min(hiredate)over()) min year, 
mod(year(min(hiredate)over()),10) mod yr, 
row number()over()-1 rn 
from emp fetch first 10 rows only 







































































YR MIN YEAR MOD YR RN 
1980 1980 0 0 
1981 1980 0 1 
1982 1980 0 2 
1983 1980 0 3 
1984 1980 0 4 
1985 1980 0 5 
1986 1980 0 6 
1987 1980 0 7 
1988 1980 0 8 
1989 1980 0 9 


select min year-mod(min year,10)«rn as yr, 
min, year, 
mod(min year,10) as mod yr 
rn 
from ( 
select (select min(extract(year from hiredate)) 
from emp) as min year, 


id-1 as rn 
from t10 
)x 
YR MIN YEAR MOD YR RN 
1980 1980 0 0 
1981 1980 0 1 
1982 1980 0 2 
1983 1980 0 3 
1984 1980 0 4 
1985 1980 0 5 
1986 1980 0 6 
1987 1980 0 7 
1988 1980 0 8 
1989 1980 0 9 











select year(hiredate) yr, count(*) cnt 
from emp 
group by year(hiredate) 























YR CNT 

TREES š 

1981 10 

1982 2 

1983 1 
Au. PRESE Y SI Ek l E] X, SREE ERADAN, dx EE 
的 计数 结果 。 
10.5 ”生成 连续 的 数值 
1. 问题 


你 希望 有 一 个 “ 行 数据 生成 器 ”*"。 如 果 你 的 查询 里 需要 数据 透视 表 ， 就 用 得 着 这 个 行 数据 
生成 器 。 例 如 ， 你 想 返 回 如 下 所 示 的 结果 集 ， 并 且 可 以 为 它 指定 任意 数目 的 行 数据 。 


ID 





. 1 
. P= ' 
° @ O O —I OO R QON PE 1 


如 果 数 据 库 提 供 了 可 以 动态 地 生成 行 数据 的 内 置 函 数 ， 那 么 就 不 需要 预先 创建 一 个 固定 行 
数 的 数据 透视 表 。 这 就 是 动态 的 行 数 据 生 成 器 如 此 有 用 的 原因 。 否 则 ， 我 们 必须 借助 一 个 
传统 的 、 行 数 固定 (也许 并 不 够 用 ) 的 数据 透视 表 来 生成 所 需 的 行 数 据 。 

2. 解决 方案 

本 解决 方案 展示 如 何 返 回 从 1 开始 递增 至 10 的 10 行 数据 。 我 们 也 可 以 简单 地 改动 一 下 代 
码 ， 以 返回 任意 数目 的 行 。 

可 以 返回 从 1 开始 递增 的 值 ， 这 种 能 力 为 其 他 许多 问题 的 解决 方案 打开 了 方便 之 门 。 例 
如 ， 我 们 可 以 生成 数字 ， 并 加 上 日 期 值 ， 这 样 就 能 生成 连续 的 日 期 了 。 也 可 以 借助 这 些 数 
字 来 解析 字符 串 。 
DB2 和 SQL Server 

使 用 WITH 递归 查询 生成 一 系列 含有 递增 值 的 行 。 先 借助 一 个 像 T1 这样 的 只 有 1 行 数据 的 
表 来 启动 行 数据 生成 操作 ， 其 余 的 交 给 WITH 子 句 即 可 。 
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with x (id) 
as ( 
select 1 
from t1 
union all 
select id+1 
from x 
where id«1 <= 10 


) 


select * from x 


@ O OO +I O n + Q) N P 





Ë 











1 with x (id) 

2 as ( 

3 values (1) 

4 union all 

5 select id+1 

6 from x 

7 where id«1 «- 10 
8 

9 


) 


select * from x 


Oracle 





硬是 另 一 个 替代 方案 ， 只 适用 于 DB2。 该 方案 的 优点 是 不 需要 TK, 


使 用 CONNECT BY 递归 查询 (适用 于 Oracle 9i 及 后 续 版 本 )。 如 果 使 用 的 是 Oracle 9 ， 我 们 要 





么 把 CONNECT BY 放 入 一 个 内 秽 视 图 





with x 
as ( 
select level id 
from dual 
connect by level «- 10 


) 


select * from x 


"Oo Cn + Q) N HG 


, EAR 


巴 它 放 进 WITH 子 句 。 





对 于 Oracle Database 10g 及 后 续 版 本 ， 则 可 以 用 MODEL 子 句 生 成 行 数据 。 


select array id 
from dual 
model 
dimension by (0 idx) 


rules iterate (10) ( 


array[iteration number] = iteration_number+1 


1 
2 
3 
4 
5 measures(1 array) 
6 
7 
8 


) 
PostgreSQL 





使 用 GENERATE SERIES 函数 ， 该 函数 就 是 为 快速 生成 行 数据 而 设计 的 。 


1 select id 


2 from generate series (1,10) x(id) 





3. 讨论 

DB2 和 SQL Server 

WITH 递归 查询 逐步 递增 ID (初始 值 为 1) ， 直 到 背离 了 WHERE 子 名 的 条 件 为 止 。 为 了 开启 
递归 操作 ， 需 要 先生 成 第 一 行 数 据 ， 这 一 行 里 包含 的 值 应 该 是 1。 我 们 可 以 通过 SELECT 1 
FROM T1 实现 这 一 点 ，T1 表 只 包含 一 行 数据 ， 对 于 DB2 而 言 ， 还 可 以 使 用 VALUES 子 句 生成 
只 含有 一 行 数据 的 结果 集 。 

Oracle 

本 解决 方案 把 CONNECT BY 子 查 询 放 进 了 WITH 子 句 。 在 WHERE 子 句 中 断 之 前 ， 行 数据 会 被 连 
续 生成 出 来 。Oracle 会 自动 递增 伪 列 LEVEL 的 值 ， 我 们 不 必 再 做 什么 。 


在 MODEL 子 句 解决 方案 里 ， 有 一 个 显 式 的 ITERATE 命令 ， 该 命令 帮助 生成 多 行 数据 。 如 果 
没有 ITERATE 子 句 ， 则 只 返回 一 行 数 据 ， 因 为 DUAL 表 仅 包含 一 行 数据 。 


select array id 
from dual 
model 
dimension by (0 idx) 
measures(1 array) 
rules () 

































































ID 
1 

MODEL 子 句 不 仅 能 让 我 们 像 访 问 数组 一 样 访 问 行 数据 ， 还 允许 我 们 方便 地 创建 新 的 行 或 
返回 表 里 不 存在 的 行 。 在 本 解决 方案 中 ，IDX 是 数组 下 标 (数组 里 某 个 特定 值 的 位 置 )， 
ARRAY (别名 ID) 是 行 数 据 构成 的 “数组 ”。 第 一 行 的 默认 值 是 1， 可 以 通过 ARRAY[O] 来 访 
问 。Oracle 提供 了 ITERATION NUMBER 函数 ， 以 便 我 们 知道 迄 代 次 数 。 本 解决 方案 迭代 了 10 
次 ， 因 而 ITERATION_NUMBER 从 0 增加 到 了 9。 为 每 个 ITERATION_NUMBER 值 加 上 1， 结果 就 
是 从 1 到 10。 


执行 以 下 查询 ， 会 更 便于 我 们 理解 MODEL 子 句 的 作用 。 


select 'array['||idx||'] = '||array as output 
from dual 
model 
dimension by (0 idx) 
measures(1 array) 
rules iterate (10) ( 
array[iteration number] = iteration number41 


) 


OUTPUT 















































array[0] 
array[1] 
array[2] 
array[3] 
array[4] 
array[5] 
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array[6] 
array[7] 
array[8] 
array[9] 


| 0 - 


PostgreSQL 

全 部 工作 都 交 给 GENERATE SERIES 函数 来 完成 。 该 函数 有 3 个 参数 ， 它 们 都 是 数值 类 型 。 
第 一 个 参数 是 初始 值 ， 第 二 个 参数 是 结束 值 ， 第 三 个 参数 是 可 选项 ， 代 表 “ 步 长 ”( 每 次 
增加 的 值 )。 如 果 没 有 指定 第 3 个 参数 ， 则 默认 每 次 增加 1, 

GENERATE, SERIES 函数 功能 强大 ， 我 们 传递 给 它 的 参数 甚至 可 以 不 是 常量 。 例 如 ， 我 们 有希 
望 返回 5 行 数据 ， 初 始 值 为 10， 结 束 值 为 30， 步 长 为 5， 那 么 就 应 该 会 得 到 如 下 所 示 的 
结果 集 。 


ID 



























































为 了 达到 上 述 目 的 ， 我们 其 至 可 以 写 出 类 似 这 样 的 代码 。 


select id 
from generate series( 
(select min(deptno) from emp), 
(select max(deptno) from emp), 
5 
) x(id) 


需要 注意 的 是 ， 我 们 在 编写 以 上 查询 代码 的 时 候 并 不 知道 要 传递 给 GENERATE, SERIES 函数 
的 参数 值 是 什么 。 只 有 当 实 际 执行 主 查询 的 时 候 ， 那 两 个 子 查询 才 会 把 实际 的 参数 值 计 算 
出 来 。 
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上 毫 无 疑问 ， 到 目前 为 止 本 书 都 在 讲 查 询 。 我 们 已 经 讨论 了 各 种 各 样 的 查询 ， 它 们 使 用 连 
Ez. WHERE 子 句 和 分 组 等 技巧 筛选 出 我 们 所 需要 的 结果 。 不 过 ， 有 一 些 类 型 的 查询 操作 不 
同 于 其 他 的 查询 。 有 时候 我 们 想 一 次 显示 一 页 结果 集 。 关 于 这 个 问题 ， 一 方面 要 查找 出 我 
们 希望 显示 的 全 部 结果 。 另 一 方面 则 是 在 用 户 浏 览 查询 结果 的 过 程 中 ， 我 们 需要 不 断 地 查 
找 下 一 页 要 显示 的 内 容 。 有 些 人 可 能 认为 分 页 不 应 该 属于 查询 问题 ， 但 它 可 以 被 认为 是 查 
询问 题 ， 并 且 我 们 也 可 以 用 SQL 查询 的 方式 来 解决 这 类 问题 。 本 章 将 主要 介绍 这 一 类 查询 
的 解决 方案 。 


11.1 结果 集 分 页 


1. 问题 

你 想 对 结果 集 进行 分 页 ， 或 者 “滚动 浏览 ”一 组 结果 和 集 。 例 如 ， 你 希望 从 EMP 表 返 回 最 前 
面 的 5 条 工资 记录 ， 然 后 返回 接 下 来 的 5 条 ， 等 等 。 你 的 目的 是 让 用 户 一 次 看 到 5 条 记 
录 ， 并 在 每 次 点 击 “ 下 一 页 ”按钮 之 后 变换 显示 内 容 。 

2. 解决 方案 

SQL 里 并 没有 “最 先 *”“ 最 后 ”或 “下 一 个 ”这 样 的 概念 ， 我 们 必须 对 行 记录 做 出 明确 的 
排序 。 只 有 做 过 了 排序 ， 才 有 可 能 准确 地 从 结果 集中 返回 指定 区 间 的 记录 。 

DB2. Oracle 和 SQL Server 

使 用 窗口 函数 ROW. NUMBER OVER 实现 排序 ， 并 且 在 WHERE 子 句 中 指定 我 们 希望 返回 的 行 。 例 
如 ， 返 回 第 1 到 第 5 fT. 

























































































select sal 
from ( 
select row_number() over (order by sal) as rn, 
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sal 
from emp 
) x 


where rn between 1 and 5 


SAL 
800 
950 
1100 
1250 
1250 


H 





然后 ， 返 回 第 6 行 到 第 10 £T. 
select sal 
from ( 
select row_number() over (order by sal) as rn, 
sal 
from emp 


where rn between 6 and 10 


通过 改变 WHERE 子 句 ， 我 们 能 返回 任意 区 间 内 的 行 。 


MySQL 和 PostgreSQL 
对 于 这 两 种 数据 库 而 言 ， 深 动 结果 集 非 常 容易 ， 因 为 它们 支持 LIMIT 和 OFFSET 子 句 。 使 用 
LIMIT 子 句 指定 要 返回 的 行 数 ， 使 用 OFFSET 子 句 指定 要 跳 过 的 行 数 。 例 如 ， 按 照 工资 排序 
返回 最 前 面 的 5 行 。 

select sal 


from emp 
order by sal limit 5 offset 0 

















然后 ， 返 回 接 下 来 的 5 fr. 


select sal 
from emp 
order by sal limit 5 offset 5 








LIMIT 和 OFFSET 子 名 使 得 MySQL 和 PostgreSQL 解决 方案 的 代码 变 得 更 简单 ， 而 且 更 具 可 
读 性 。 
3. 讨论 
DB2、Oracle 和 SQL Server 
WAS] x 里 的 窗口 函数 ROW. NUMBER OVER 将 会 为 每 一 行 工资 记录 分 配 一 个 唯一 的 数字 编号 
(从 1 开始 递增 )。 下 面 是 内 咀 视图 X 的 查询 结果 集 。 

select row_number() over (order by sal) as rn, 


sal 
from emp 


























PB =P = == 
+ QQ N P @ O O —I wm 和 上 wm 上 
N 
co 
= 
© 


一 旦 每 一 行 工 资 记录 都 被 指定 了 数字 编号 ， 通 过 指定 RN 的 值 就 可 以 筛选 出 我 们 想 要 返回 
的 区 间 。 


对 于 Oracle 用 户 来 说 ， 有 一 个 替代 方案 可 以 用 ROWNUM 函数 来 代替 ROW. NUMBER OVER 函数 ， 
同样 能 为 每 一 行 记录 生成 一 个 序号 。 


select sal 
from ( 
select sal, rownum rn 
from ( 
select sal 
from emp 
order by sal 
) 
) 


where rn between 6 and 10 
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使 用 RowNUN 的 话 ， 就 需要 多 写 一 层 子 查询 。 最 内 层 的 子 查 询 对 工资 进行 排序 。 接 下 来 的 外 
层 子 查询 为 每 一 行 分 配 序号 。 最 后 ， 最 外 层 的 SELECT 返回 我 们 希望 显示 的 数据 。 

MySQL 和 PostgreSQL 

SELECT 里 的 OFFSET 子 句 使 得 整个 查询 语句 看 起 来 更 加 直观 ， 更 具 可 读 性 。oOFFSET 等 于 0 
表示 将 从 第 1 行 开始 读 取 ，0OFFSET 等 于 5 表示 从 第 6 行 开始 ，OFFSET 等 于 10 表示 从 第 11 
行 开始 。LIMIT 子 句 则 限定 了 返回 的 记录 行 数 。 通 过 结合 这 两 种 子 句 ， 我 们 就 能 很 容易 地 
在 结果 集中 指定 从 哪 一 行 开始 ， 并 同时 指定 返回 多 少 行 。 


11.2 跳 过 n 行 记录 
1. 问题 


你 想 用 一 个 查询 来 隔行 返回 EMP 表 中 的 记录 ; 你 希望 获得 第 一 个 员工 、 第 三 个 员工 ， 等 
等 。 例 如 ， 从 下 面 的 结果 集 : 


























SCOTT 
TURNER 
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2. 解决 方案 

为 了 从 一 个 结果 集中 跳 过 第 2 行 、 第 4 行 或 第 n 行 ， 我 们 必须 对 结果 集 先 排序 ， 否 则 就 没 
有 所 谓 的 “第 一 个 ” “下 一 个 ”“ 第 二 个 ”或 者 “第 四 个 ”等 概念 。 

DB2. Oracle 和 SQL Server 

使 用 窗口 函数 ROW. NUMBER OVER 为 每 一 行 分 配 一 个 序号 ， 这 样 就 可 以 借助 模 函 数 跳 过 我 们 不 
想 要 的 行 了 。DB2 和 Oracle 的 模 函 数 是 MOD, SQL Server 则 使 用 % 操作 符 。 下 面 的 例子 使 
用 MOD 跳 过 编号 为 偶数 的 行 。 



































1 select ename 

2 from ( 

3 select row_number() over (order by ename) rn, 
4 ename 

5 from emp 

6 ) x 

7 


where mod(rn,2) = 1 
MySQL 和 PostgreSQL 


这 两 种 数据 库 不 提供 支持 排序 或 为 每 一 行 数据 编排 序号 的 内 置 函数 ， 因 而 需要 使 用 标量 子 
查询 来 模拟 实现 类 似 功能 (本 例 中 根据 员工 名 字 排 序 )， 然 后 使 用 模 函 数 跳 过 不 需要 的 行 。 














1 select x.ename 

2 from ( 

3 select a.ename, 

4 (select count(*) 
5 from emp b 
6 where b.ename <= a.ename) as rn 
7 from emp a 
8 )x 
9 


where mod(x.rn,2) = 1 
3. 讨论 
DB2. Oracle 和 SQL Server 
TEERAA x 里 调用 窗口 函数 ROW. NUMBER OVER 将 会 为 每 一 行 分 配 一 个 序号 (没有 附加 任何 
条 件 ， 也 不 去 除 重复 的 姓名 ) ， 结 果 显 示 如 下 。 


select row_number() over (order by ename) rn, ename 
from emp 














P. @ XO O +I O n B Q N P 
c 
> 
= 
m 
an 


== 
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12 SMITH 
13 TURNER 
14 WARD 





最 后 ， 只 需 调用 模 函 数 跳 过 不 需要 的 行 即 可 。 
MySQL 和 PostgreSQL 
因为 没有 内 置 函 数 帮助 我 们 为 每 一 行 编号 ， 我 们 改 用 标量 子 查 询 为 员工 的 名 字 编 号 。 内 骸 
x 实现 了 为 每 个 名 字 编 号 ， 结 果 如 下 所 示 。 





视图 











select a.ename, 
(select count(*) 





from emp b 
where b.ename <= a.ename) as rn 
from emp a 

ENAME RN 
ADAMS 1 
ALLEN 2 
BLAKE 3 
CLARK 4 
FORD 5 
JAMES 6 
JONES 7 
KING 8 
MARTIN 9 
MILLER 10 
SCOTT 11 
SMITH 12 
TURNER 13 
WARD 14 


最 后 ， 针 对 产生 的 行 编号 调用 模 国 数 来 跳 过 不 需要 的 行 。 


.3 在 外 连接 查询 里 使 用 OR 逻 辑 


1. 问 


11 


你 想 UA JAN 


部 门 信息 (但 不 包含 员工 信息 )。 








返回 部 门 编号 为 10 和 20 的 全 体 员 工 的 名 子 和 部 门 信息 ， 以 及 部 门 编 号 为 30 和 40 的 
你 最 初试 图 这 样 做 。 














select e.ename, d.deptno, d.dname, d.loc 


from dept d, emp e 
where d.deptno = e.deptno 


and (e.deptno - 10 or e.deptno - 20) 
order by 2 
ENAME DEPTNO DNAME LOC 
CLARK 10 ACCOUNTING NEW YORK 
KING 10 ACCOUNTING NEW YORK 
MILLER 10 ACCOUNTING NEW YORK 
SMITH 20 RESEARCH DALLAS 





ADAMS 
FORD 

SCOTT 
JONES 


以 上 查询 里 的 连接 操作 是 内 连接 ， 


信息 。 





20 RESEARCH 
20 RESEARCH 
20 RESEARCH 
20 RESEARCH 


DALLAS 
DALLAS 
DALLAS 
DALLAS 





























select 
from 
on 
where 
or 
order 


MILLER 
SMITH 
ADAMS 








在 下 面 的 查询 里 你 又 试图 将 EMP 322 





e.ename, d.deptno, d.dname, d.loc 


dept d left join emp e 
(d.deptno = e.deptno) 
e.deptno = 10 

e.deptno = 20 

by 2 


DEPTNO DNAME 


10 ACCOUNTING 
10 ACCOUNTING 
10 ACCOUNTING 
20 RESEARCH 
20 RESEARCH 
20 RESEARCH 
20 RESEARCH 
20 RESEARCH 


NEW YORK 
NEW YORK 
NEW YORK 
DALLAS 
DALLAS 
DALLAS 
DALLAS 
DALLAS 


其 实 ， 你 只 是 希望 得 到 如 下 所 示 的 结果 集 。 


ENAME 


DEPTNO DNAME 


MILLER 
SMITH 
JONES 
SCOTT 
ADAMS 
FORD 


2. 解决 方案 


10 ACCOUNTING 
10 ACCOUNTING 
10 ACCOUNTING 
20 RESEARCH 
20 RESEARCH 
20 RESEARCH 
20 RESEARCH 
20 RESEARCH 
30 SALES 

40 OPERATIONS 


NEW YORK 
NEW YORK 
NEW YORK 
DALLAS 
DALLAS 
DALLAS 
DALLAS 
DALLAS 
CHICAGO 
BOSTON 


DB2, MySQL, PostgreSQL 和 SQL Server 
把 oR 条 件 移 到 JOIN 子 句 里 。 





1 
2 
3 
4 
5 


Se. S ner DR DACH 


on (d.deptno = e.deptno 
and (e.deptno-10 or 


order by 2 











WR] 











select e.ename, d.deptno, d.dname, d.loc 
from dept d left join emp 


e 


e.deptno=20)) 


过 滤 EMP.DEPTNO， 然 后 























执行 外 连接 。 





` 连 接 到 DEPT 表 ， 但 仍然 没有 得 到 正确 的 结果 集 。 


因此 返回 的 结果 集 里 不 包含 DEPTN0 是 30 和 40 的 部 门 
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1 
2 
3 
4 
5 
6 
7 
8 


Oracle 
对 于 Oracle 9; 


select e.ename, d.deptno, d.dname, d.loc 


(select ename, deptno 
from emp 


where deptno in ( 10, 
) e on ( e.deptno = d.deptno ) 
order by 2 





及 后 续 版 本 ， 上 述 针 对 和 


from dept d, emp e 


where d. 


deptno = e.deptno (+) 


20 ) 


select e.ename, d.deptno, d.dname, d.loc 
from dept d 
left join 


其 他 数据 库 的 解决 方案 也 适用 。 除 此 之 外 ， 我 们 也 可 
以 使 用 CASE 或 DECODE 的 变通 方案 。 下 面 是 使 用 CASE 的 解决 方案 


and d.deptno = case when e.deptno(+) 
when e.deptno(+) 


order by 


Tt TRIR Sell a —R 


select e.ename, d.deptno, d.dname, d.loc 


from de 
where d. 


end 
2 





pt d, emp e 
deptno = e.deptno (+) 





10 then e.deptno(-*) 
20 then e.deptno(^) 


的， 但 用 到 了 DECODE 函数 。 


and d.deptno = decode(e.deptno(+),10,e.deptno(+), 
20,e.deptno(+)) 


order by 


如 果 用 了 Oracle 专 有 的 外 连接 语法 “(+)” 
作 就 会 返回 错误 。 解 决 办 法 是 把 IN 或 OR 条 


select e.ename, d.deptno, d.dname, d.loc 





from de 


(s 


) 


where d 
order by 


3. 讨论 


2 


pt d, 
elect ename, deptno 
from emp 


where deptno in ( 10, 20 ) 


e 


.deptno = e.deptno (+) 


2 


DB2, MySQL, PostgreSQL 和 SQL Server 


针对 这 些 数据 库 ， 我 们 提供 了 两 种 解决 方案 


成 为 连接 条 件 的 一 部 分 。 这 样 一 来 ， 我 们 既 能 饰 选 出 EMP 表 的 数据 ， 又 不 会 丢掉 DEPT 表 里 


DEPTNO 等 于 30 和 40 的 数据 。 





第 二 种 解决 方案 把 过 滤 条 件 移 到 了 内 骨 视 图 里 。 
我 们 感 兴趣 的 行 。 然 后 ， 这 些 
础 表 ， 因 此 包括 部 门 编号 为 30 和 40 在 内 的 所 有 部 门 都 会 被 返 


EMP XE HH EJ H 














o 





行 被 外 连接 到 DEPT R, DEPT 表 是 外 连接 的 基 


， 并 在 外 连接 列 上 用 到 了 IN 或 OR 条 件 ， 查 询 操 
VEEESI— ^ VAERTRLE Hf 





第 一 种 把 OR 条 件 移 到 了 JOIN 子 句 里 ， 使 它 











内 舰 视 图 E 基 于 EMP.DEPTNO 过 滤 数 据 ， 从 














Ei 


° 





Oracle 

旧式 的 外 连接 语法 似乎 存在 缺陷 ， 我 们 使 用 了 CASE 和 DECODE 函数 以 避免 该 问题 。 除 此 之 
外 ， 使 用 了 内 骨 视 图 E 的 那个 解决 方案 ， 首 先 从 EMP 表 里 算 选 出 我 们 感 兴 趣 的 行 ， 然 后 再 
外 连接 到 DEPT。 


11.4 ”识别 互 逆 的 记录 

1. 问题 

你 有 一 张 表 ， 其 中 包括 了 两 次 考试 的 成 绩 ， 你 想 找 出 哪些 分 数 互 逆 的 (reciprocal), iT 
先 看 一 下 下 面 视图 V 的 结果 集 。 












































select * 
from V 

TEST1 TEST2 
20 20 
50 25 
20 20 
60 30 
70 90 
80 130 
90 70 
100 50 
110 55 
120 60 
130 80 
140 70 


仔细 看 上 述 结 果 ， 可 以 发 现 TESTA 等 于 70 的 考试 分 数 和 TEST2 等 于 90 的 考试 分 数 是 互 逆 
的 (TEST1 存在 一 个 90 的 分 数 ， 并 且 TEST2 也 存在 一 个 70 的 分 数 )。 同 样 地 ，TEST1 等 于 
80 的 分 数 和 TEST2 等 于 130 的 分 数 也 是 互 逆 的 ， 因 为 TEST1 里 有 130, TEST2 里 也 有 80, 
并 且 ，TEST1 等 于 20 的 分 数 和 TEST2 等 于 20 的 分 数 也 是 互 逆 的 ， 因 为 同样 存在 TEST2 等 于 
20、 并 且 TEST1 等 于 20 的 记录 。 你 只 希望 识别 出 互 逆 的 记录 的 集合 。 因 此 ， 你 希望 得 到 的 
结果 集 如 下 所 示 。 



































TEST1 TEST2 
20 20 
70 90 
80 130 
而 不 是 下 面 的 这 个 。 
TEST1 TEST2 
20 20 
20 20 
70 90 
80 130 
90 70 
130 80 
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2. 解决 方案 
使 用 自 连 接 识别 出 TEST1 等 于 TEST2， 并 且 TEST2 等 于 TEST1 的 那些 行 。 
select distinct v1.* 
from V v1, V v2 
where vi.test1 = v2.test2 


and vi.test2 = v2.test1 
and v1.test1 <= vl.test2 


3. 讨论 
自 连 接 产 生 了 一 组 笛 卡 儿 积 ， 这 样 一 个 TEST1 分 数 可 以 和 每 一 个 TEST2 分 数 进行 比较 ;反之 ， 
一 个 TEST2 分 数 也 可 以 和 每 一 个 TEST1 分 数 进行 比较 。 下 面 的 查询 将 会 识别 出 互 逆 的 分 数 。 


select v1.* 
from V v1, V v2 


























where v1.test1 = v2.test2 

and vi.test2 = v2.testi1 
TEST1 TEST2 
20 20 
20 20 
20 20 
20 20 
90 70 
130 80 
70 90 
80 130 


使 用 DISTINCT 能 确保 从 最 后 的 结果 集 里 删除 掉 重 复 项 。WHERE 子 句 的 最 后 一 个 过 滤 条 件 
(and V1.TEST1 <= V1.TEST2) 将 确保 只 返回 TEST1 小 于 或 等 于 TEST2 的 那 一 对 互 逆 的 分 数 。 


上- LL ^-^ 
11.5 提取 最 靠 前 的 n 行 记录 
1. 问题 
你 想 基 于 某 种 排序 方式 从 结果 集中 提取 出 限定 数目 的 记录 。 例 如 ， 你 希望 返回 S 个 工资 最 
高 的 员工 的 姓名 和 工资 。 
2. 解决 方案 
本 解决 方案 的 关键 之 处 有 两 点 ， 首先 要 基于 我 们 感 兴趣 的 列 对 数据 集 进行 排序 ， 然 后 从 结 
果 集 里 提取 出 所 需 数 目的 行 记 录 。 
DB2、Oracle 和 SQL Server 
本 解决 方案 需要 用 到 窗口 函数 。 使 用 哪个 窗口 函数 取决 于 我 们 希望 如 何 处 理 Tie', 下面 的 解 
决 方案 选择 了 DENSE RANK 函数 ， 这 意味 着 每 一 个 Tie 只 会 被 计数 一 次 。 























注 1: 此 处 Tie 意 为 平手 .平局 "。 本 书 保持 不 译 。 在 排序 计算 的 过 程 中 ,如 果 一 个 名 次 上 出 现 了 多 个 候选 项 ， 
则 每 一 个 候选 项 均 可 称 之 为 “一 个 Tie”。 有 的 数据 库 函数 的 计算 结果 中 允许 出 现 多 个 Tie， 有 的 则 仅 
返回 一 个 。 一 一 译 者 注 
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1 select ename,sal 

2 from ( 

3 select ename, sal, 

4 dense_rank() over (order by sal desc) dr 
5 from emp 

6 ) x 

7 


where dr <= 5 




















上 述 查 询 返 回 的 行 数 可 能 超过 5, 但 只 有 5 种 不 同 的 工资 值 。 如 果 你 希望 不 考虑 Tie， 只 返 
E $ 行 记录 的 话 ， 那 就 使 用 ROW NUMBER OVER (因为 该 函数 不 关心 Tie). 

MySQL 和 PostgreSQL 

使 用 标量 子 查询 为 每 个 工资 值 创 建 一 个 序号 ， 然 后 通过 上 述 序 号 限制 子 查 询 的 结果 行 数 。 








1 select ename,sal 

2 from ( 

3 select (select count(distinct b.sal) 
4 from emp b 

5 where a.sal <= b.sal) as rnk, 
6 a.sal, 

7 a.ename 

8 from emp a 

9 

0 


) 


where rnk <= 5 


= 


3. 讨论 

DB2, Oracle 和 SQL Server 

VH BHL] X 里 的 窗口 函数 DENSE. RANK OVER 完成 了 全 部 工作 ， 执 行 该 函数 后 得 到 的 结果 如 下 
所 示 。 


select ename, sal, 
dense_rank() over (order by sal desc) dr 


from emp 
ENAME SAL DR 
KING 5000 1 
SCOTT 3000 2 
FORD 3000 2 
JONES 2975 3 
BLAKE 2850 4 
CLARK 2450 5 
ALLEN 1600 6 
TURNER 1500 7 
MILLER 1300 8 
WARD 1250 9 
MARTIN 1250 9 
ADAMS 1100 10 
JAMES 950 11 
SMITH 800 12 


最 后 ， 我 们 只 需要 返回 DR 小 于 或 等 于 5 的 行 即 可 。 
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MySQL 和 PostgreSQL 
VNHECHLES x 里 的 标量 子 查 询 为 工资 值 编 排序 号 ， 结 果 如 下 。 


select (select count(distinct b.sal) 
from emp b 
where a.sal <= b.sal) as rnk, 
a.sal, 
a.ename 
from emp a 























最 后 ， 返 回 RNK 小 于 或 等 于 5 的 那些 行 即 可 。 


11.6 找 出 最 大 和 最 小 的 记录 








1. 问题 
你 想 找 出 表 里 的 “极端 ” 值 。 例 如 ， 你 希望 找到 EMP 表 中 工资 最 高 和 最 低 的 员工 。 
2. 解决 方案 


DB2. Oracle 和 SQL Server 
使 用 窗口 函数 MIN OVER 和 MAX OVER 2 SIFRE ge CREE es BJ T EL. PHELPS s 1E £r HL AE 
如 下 所 示 。 


1 select ename 

2 from ( 

3 select ename, sal, 

4 min(sal)over() min_sal, 
5 max(sal)over() max_sal 
6 from emp 
7 ) x 
8 


where sal in (min sal,max sal) 


MySQL 和 PostgreSQL 
使 用 两 个 子 查 询 ， 分 别 返 回 SAL 的 最 小 值 和 最 大 值 。 








1 select ename 

2 from emp 

3 where sal in ( (select min(sal) from emp), 
4 (select max(sal) from emp) ) 


DB2, Oracle 和 SQL Server 


有 了 窗口 函数 MIN OVER 和 MAX OVER， 我 们 就 能 在 每 一 行 里 访问 到 最 低 和 最 高 的 工资 值 。 内 














WILE X 的 查询 结果 集 如 下 所 示 。 


select ename, sal, 
min(sal)over() min_sal, 
max(sal)over() max_sal 














from emp 
ENAME SAL MIN_SAL MAX_SAL 
SMITH 800 800 5000 
ALLEN 1600 800 5000 
WARD 1250 800 5000 
JONES 2975 800 5000 
MARTIN 1250 800 5000 
BLAKE 2850 800 5000 
CLARK 2450 800 5000 
SCOTT 3000 800 5000 
KING 5000 800 5000 
TURNER 1500 800 5000 
ADAMS 1100 800 5000 
JAMES 950 800 5000 
FORD 3000 800 5000 
MILLER 1300 800 5000 


得 到 了 上 述 结果 集 之 后 ， 剩 下 的 工作 就 是 返回 SAL 等 于 MIN SAL 或 MAX. SAL 的 行 。 





MySQL 和 PostgreSQL 














本 解决 方案 在 IN 列表 里 用 了 两 个 子 查 询 分 别 找 出 EMP 表 的 最 低 和 最 高 工资 值 。 外 层 查 询 返 





回 的 行 就 是 和 子 查询 返回 值 相 匹配 的 结果 。 


11.7 ”查询 未 来 的 行 


1. 问题 














如 果 有 员工 的 工资 低 于 紧 随 其 后 人 职 的 同事 ， 那 么 你 希望 把 这 些 人 找 
如 下 所 示 的 结果 集 。 





ENAME SAL HIREDATE 
SMITH 800 17-DEC-80 
ALLEN 1600 20-FEB-81 
WARD 1250 22-FEB-81 
JONES 2975 02-APR-81 
BLAKE 2850 01-MAY-81 


8 来。 我 们 先 看 一 下 
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CLARK 
URNER 
MARTIN 
KING 
JAMES 
FORD 
MILLER 
SCOTT 
ADAMS 


2450 09-JUN-81 
1500 08-SEP-81 


1250 
5000 

950 
3000 
1300 
3000 
1100 


28- 
17- 
03- 
03- 
23- 
09- 
12- 


SEP- 
NOV- 
DEC- 
DEC- 
JAN- 
DEC- 
JAN- 


81 
81 
81 
81 
82 
82 
83 


SMITH, WARD, MARTIN, JAMES 以 及 MILLER 的 工资 低 于 紧 随 其 后 入 职 的 同事 ， 因 
此 ， 他 们 就 是 你 要 找 的 查询 结果 。 
2. 解决 方案 
首先 要 确定 “未 来 ”的 含义 。 我 们 必须 对 结果 集 排 序 以 便 能 明确 判断 某 一 行 记 录 含 有 的 值 


是 否 “Ha” 


于 另 一 行 。 





DB2, MySQL, PostgreSQL 和 SQL Server 
使 用 子 查 询 为 每 一 位 员工 计算 出 如 下 的 值 。 


。 入 职 比 他 晚 、 且 工资 更 高 的 员工 当中 最 早 入 职 的 那个 人 的 入 职 日 期 。 
° 入 职 比 他 晚 的 员工 当中 最 早 入 职 的 那个 人 的 入 职 日 期 。 


如 果 上 述 两 个 日 期 相等 ， 


1 
2 
3 
4 
5 
6 
7 
8 
9 
0 
1 


Oracle 


可 以 使 用 窗口 函数 LEAD OVER 访问 下 一 个 入 职 的 员工 的 工资 。 剩 下 的 就 非常 简单 了 ， 只 


from ( 


那么 这 个 人 就 是 我 们 要 找 的 。 
select ename, sal, hiredate 


select a.ename, a.sal, a.hiredate, 


(select min(hiredate) from emp b 
where b.hiredate > a.hiredate 
and b.sal 
(select min(hiredate) from emp b 
where b.hiredate > a.hiredate) as next hire 


from emp a 


)x 





where next sal grtr 


» a.sal ) as next sal grtr, 


= next hire 


am 





要 检查 一 下 该 工资 值 是 否 更 高 即 可 。 


1 
2 f 
3 
4 
5 f 
6 
7 
3. 讨论 











rom ( 


select ename, sal, hiredate 


select ename, sal, hiredate, 


lead(sal)over(order by hiredate) next sal 


rom emp 


) 


where sal « next sal 


DB2, MySQL, PostgreSQL 和 SQL Server 


标量 子 查询 为 每 一 位 员工 返 








回 紧 随 其 后 入 职 的 第 一 个 人 的 HIREDATE， 以 及 入 职 时 间 更 晚 且 





工资 更 高 的 第 一 个 人 的 HIREDATE。 下 面 展 示 了 未 经 过 滤 处 理 的 数据 。 


select a.ename, a.sal, a.hiredate, 


(select 
where 
and 
(select 
where 

from emp a 
ENAME SAL 
SMITH 800 
ALLEN 1600 
WARD 1250 
JONES 2975 
MARTIN 1250 
BLAKE 2850 
CLARK 2450 
SCOTT 3000 
KING 5000 
TURNER 1500 
ADAMS 1100 
JAMES 950 
FORD 3000 
MILLER 1300 
对 于 当前 员工 而 言 ， 





人 。 下 一 步 (也 是 最 后 一 步 ) 只 返回 


min(hiredate) from emp b 
b.hiredate > a.hiredate 


b.sal 


min(hiredate) from emp b 


> a.sal ) as next, sal grtr, 


b.hiredate » a.hiredate) as next hire 


HIREDATE NEXT. SAL GRTR NEXT HIRE 


17-DEC-80 
20-FEB-81 
22-FEB-81 
02-APR-81 
28-SEP-81 
01-MAY-81 
09-JUN-81 
09-DEC-82 
17-NOV-81 
08-SEP-81 
12-JAN-83 
03-DEC-81 
03-DEC-81 
23- JAN- 82 


入 职 时 间 比 他 晚 、 且 工资 更 高 的 的 人 不 一 定 就 是 紧 随 
NEXT_SAL_GRTR (入 职 时 间 晚 于 当 


20-FEB-81 
02-APR-81 
02-APR-81 
17-NOV-81 
17-NOV-81 
17-NOV-81 
17-NOV-81 


17-NOV-81 


23- JAN- 82 


09-DEC-82 





20-FEB-81 
22-FEB-81 
02-APR-81 
01-MAY-81 
17-NOV-81 
09-JUN-81 
08-SEP-81 
12-JAN-83 
03-DEC-81 
28-SEP-81 


23- JAN- 82 
23- JAN- 82 
09-DEC-82 














= x 


>= = 


EUER 





其 后 入 职 的 第 一 
工 、 且 工资 更 


高 的 员工 当中 最 早 入 职 的 那个 人 的 HIREDATE) 等 于 NEXT_HIRE (入 职 比 他 晚 的 员工 当中 最 
早 入 职 的 那个 人 的 HIREDATE) 的 行 。 


Oracle 


窗口 函数 LEAD OVER 正好 可 以 解决 这 一 类 问题 。LEAD OVER 不 仅 使 得 代码 更 具 可 读 性 ， 同 时 


也 让 解决 方案 变 得 更 灵活 ， 因 为 我 们 可 以 传递 一 个 参数 给 LEAD OVER， 告 诉 它 需 要 
来 多 少 行 的 数据 (默认 值 是 1 行 )。 在 所 








好 序 的 数据 集 


况 下 能 够 往 前 看 到 多 于 1 行 的 数据 是 很 重要 的 。 
下 面 的 例子 展示 了 使 用 LEAD OVER 来 看 “下 一 个 ”入 职 的 员工 的 工资 是 多 么 方便 。 


select ename, sal, hiredate, 
lead(sal)over(order by hiredate) next sal 

















HIREDATE 


NEXT. SAL 


from emp 
ENAME SAL 
SMITH 800 
ALLEN 1600 
WARD 1250 


TURNER 1500 


17-DEC-80 
20-FEB-81 
22-FEB-81 
02-APR-81 
01-MAY-81 
09-JUN-81 
08-SEP-81 





有 如 果 含 有 重复 数据 ， 那 


往 
么 


前 看 未 


这 种 情 
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MARTIN 
KING 
JAMES 
FORD 
MILLER 
SCOTT 
ADAMS 


1250 28-SEP-81 5000 


5000 17-NOV-81 950 
950 03-DEC-81 3000 
3000 03-DEC-81 1300 
1300 23-JAN-82 3000 
3000 09-DEC-82 1100 


1100 12-JAN-83 

















eji, WW OHH SAL 小 于 NEXT. SAL 的 行 。 因 为 LEAD OVER 默认 往 前 看 1 行 ， 如 果 EMP REA 
重复 数据 ， 万 其 是 当 同 一 天 入 职 的 员工 多 于 一 个 人 的 情况 下 ， 入 职 日 期 相同 的 员工 之 间 也 





会 做 SAL 比较 。 


事 的 做 比较 ， 关 


方案 。 




















这 可 能 偏离 了 我 们 的 预期 。 如 果 我 们 想 要 把 每 一 个 员工 的 SAL 和 下 一 个 同 
F 旦 明确 要 求 屏 蔽 掉 在 同一 天 入 职 的 其 他 员工 ， 那 么 就 需要 用 到 下 面 的 替代 
































select ename, sal, hiredate 


from ( 


select ename, sal, hiredate, 
lead(sal,cnt-rn+1)over(order by hiredate) next sal 


from ( 


select ename,sal,hiredate, 
count(*)over(partition by hiredate) cnt, 
row number(J)over(partition by hiredate order by empno) rn 


from emp 


) 
) 


where sal « next sal 


上 述 做 法 的 关键 在 于 找 出 从 当前 行 到 它 应 该 与 之 比较 的 行 之 间 的 距离 。 例 如 ， 如 果 有 5 个 
重复 行 ， 那么 它 的 第 一 行 就 需要 跳 过 5 行 数 据 才 能 找到 正确 的 LEAD OVER 行 。 对 于 具有 重 
复 HIREDATE 的 员工 而 言 ， 那 么 CNT 代表 了 他 们 的 HIREDATE 一 共 在 多 少 行 里 出 现 过 。RN 的 
值 代表 了 DEPTNO 等 于 10 的 每 一 个 员工 的 序号 。 该 序号 的 生成 按照 HIREDATE 分 区 ， 因 此 只 
有 那些 含有 重复 HIREDATE 的 员工 才 可 能 有 大 于 1 的 RN 值 。 生 成 序号 的 时 候 先 基于 EMPNO 


做 了 排序 (我 人 
































] 只 是 随便 选 了 EMPNO 做 排序 的 基准 )。 现 在 我 们 已 经 知道 了 有 多 少 个 重复 





项 ， 而 且 每 个 重复 项 都 有 一 个 序号 ， 那 么 与 下 一 个 HIREDATE 的 距离 就 是 重复 项 的 总 数 减 去 
当前 的 序号 再 加 1， 即 “CNT-RN+1 ”。 


4. 参考 资料 
































其 他 关于 使 用 LEAD OVER 处 理 重复 项 的 例子 (并 且 有 更 详尽 、 更 彻底 的 技术 细节 讨论 ) S 


见 8.7 节 和 10.2 节 。 


11.8 行 值 轮转 


1. 问题 





你 想 返 回 每 个 员工 的 姓名 、 工 资 ， 以 及 下 一 个 最 高 和 最 低 的 工资 值 。 如 有 果 没 有 找到 更 高 或 


更 低 的 工资 值 ， 














你 希望 结果 集 可 以 “ 折 回 ”( 第 一 个 SAL 的 前 一 行 是 最 后 一 个 SAL; 反之 ， 





最 后 一 个 SAL 的 下 一 行 即 是 第 一 个 SAL)。 你 希望 返回 如 下 所 示 的 结果 和 集 。 
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ENAME SAL FORWARD REWIND 


SMITH 800 950 5000 
JAMES 950 1100 800 
ADAMS 1100 1250 950 
WARD 1250 1250 1100 
MARTIN 1250 1300 1250 
MILLER 1300 1500 1250 
TURNER 1500 1600 1300 
ALLEN 1600 2450 1500 
CLARK 2450 2850 1600 
BLAKE 2850 2975 2450 
JONES 2975 3000 2850 
SCOTT 3000 3000 2975 
FORD 3000 5000 3000 
KING 5000 800 3000 
2. 解决 方案 


对 于 Oracle 用 户 而 言 ， 窗 口 国 数 LEAD OVER 和 LAG OVER 使 得 本 问题 解决 起 来 相对 容易 ， 而 
且 代码 可 读 性 更 好 。 对 于 其 他 数据 库 ， 可 以 使 用 标量 子 查询 ， 不 过 Tie 可 能 会 带 来 问题 。 
由 于 存在 Tie 的 问题 ， 对 于 不 支持 窗口 函数 的 关系 数据 库 管 理 系统 ， 我 们 只 能 提供 一 个 近 
似 的 解决 方案 。 

DB2、SQL Server. MySQL 和 PostgreSQL 

使 用 标量 子 查询 为 每 一 个 工资 值 找到 它 的 下 一 个 和 前 一 个 的 工资 值 。 
































1 select e.ename, e.sal, 

2 coalesce( 

3 (select min(sal) from emp d where d.sal > e.sal), 
4 (select min(sal) from emp) 

5 ) as forward, 

6 coalesce( 

7 (select max(sal) from emp d where d.sal < e.sal), 
8 (select max(sal) from emp) 

9 ) as rewind 

0 

1 








1 from emp e 
1 order by 2 

Oracle 

使 用 窗口 函数 LAG OVER 和 LEAD OVER 访问 当前 行 的 上 一 行 和 下 一 行 记录 。 
1 select ename,sal, 
2 nvl(lead(sal)over(order by sal),min(sal)over()) forward, 
3 nvl(lag(sal)over(order by sal),max(sal)over()) rewind 
4 from emp 

3. 讨论 


DB2、SQL Server. MySQL 和 PostgreSQL 

标量 子 查 询 方案 并 没有 真正 解决 本 问题 。 它 只 是 一 个 近似 的 方案 ， 当 两 行 记 录 包 含 相 同 的 
SAL 时 ， 该 解决 方案 就 会 返回 不 正确 的 结果 。 不 过 ， 在 没有 窗口 函数 可 用 的 情况 下 ， 它 已 
经 是 最 好 的 方案 了 。 
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Oracle 


(默认 情况 下 ， 除 非 有 特别 指定 。) 窗口 函数 LAG OVER 和 LEAD OVER 将 分 别 返回 当前 行 的 上 
一 行 和 下 一 行 记录 。“ 上 一 行 ”或 “下 一 行 ”取决 于 oven 子 名 里 的 ORDER BY 部 分 。 如 果 仔 
细 阅 读本 解决 方案 的 代码 ， 我 们 会 发 现 它 首先 按照 SAL 排序 数据 集 ， 并 提取 出 了 当前 行 的 





上 一 行 和 下 一 行 。 


select ename,sal, 
lead(sal)over(order by sal) forward, 
lag(sal)over(order by sal) rewind 


from emp 

ENAME SAL FORWARD REWIND 
SMITH 800 950 

JAMES 950 1100 800 
ADAMS 1100 1250 950 
WARD 1250 1250 1100 
MARTIN 1250 1300 1250 
MILLER 1300 1500 1250 
TURNER 1500 1600 1300 
ALLEN 1600 2450 1500 
CLARK 2450 2850 1600 
BLAKE 2850 2975 2450 
JONES 2975 3000 2850 
SCOTT 3000 3000 2975 
FORD 3000 5000 3000 
KING 5000 3000 


注意 ， 员 工 SMITH 的 REWIND 是 Null, rfj KING 的 FORWARD 也 是 Null 




















; 这 是 因为 两 个 人 的 








SAL 分 别 是 最 低 值 和 最 高 值 。“ 问 题 ” 部 分 提 到 ，FORNARD 或 REWIND 车 出 现 Null 值 ， 则 应 
该 “ 折 回 "。 这 就 意味 着 ， 对 于 最 大 的 SAL, FORWARD 值 应 为 EMP 表 中 最 小 的 SAL， 而 对 于 最 




















小 的 SAL, REWIND 值 应 为 最 大 的 SAL。 没 有 指定 分 区 (BI OVER 子 名 后 





而 跟 一 对 空 括号 ) 的 





























窗口 函数 MIN OVER 和 MAX OVER 将 分 别 返回 最 大 和 最 小 的 SAL。 结 果 集 女 


select ename,sal, 
nvl(lead(sal)over(order by sal),min(sal)over()) forward, 
nvl(lag(sal)over(order by sal),max(sal)over()) rewind 


from emp 
ENAME SAL FORWARD REWIND 
SMITH 800 950 5000 
JAMES 950 1100 800 
ADAMS 1100 1250 950 
WARD 1250 1250 1100 
MARTIN 1250 1300 1250 
MILLER 1300 1500 1250 
TURNER 1500 1600 1300 
ALLEN 1600 2450 1500 
CLARK 2450 2850 1600 
BLAKE 2850 2975 2450 
JONES 2975 3000 2850 


IIBER. 





SCOTT 3000 3000 2975 
FORD 3000 5000 3000 
KING 5000 800 3000 


LAG OVER 和 LEAD OVER 还 有 一 个 非常 有 用 的 功能 ， 就 是 可 以 指定 向 前 或 者 向 后 移动 多 少 行 。 
对 于 本 例 而 言 ， 我 们 只 往 前 或 往 后 移动 了 一 行 。 如 果 你 想 往 前 移动 3 行 ， 并 且 往 后 移动 5 
行 ， 做 法 非常 简单 。 只 需要 指定 移动 值 分 别 为 3 和 5 即 可 ， 如 下 所 示 。 

select ename,sal, 


lead(sal,3)over(order by sal) forward, 
lag(sal,5)over(order by sal) rewind 























from emp 
ENAME SAL FORWARD REWIND 
SMITH 800 1250 
JAMES 950 1250 
ADAMS 1100 1300 
WARD 1250 1500 
MARTIN 1250 1600 
MILLER 1300 2450 800 
TURNER 1500 2850 950 
ALLEN 1600 2975 1100 
CLARK 2450 3000 1250 
BLAKE 2850 3000 1250 
JONES 2975 5000 1300 
SCOTT 3000 1500 
FORD 3000 1600 
KING 5000 2450 

11.9 对 结果 排序 
1. 问题 
你 想 对 EMP 表 里 的 工资 值 排序 ， 并 且 人 允许 Tie。 你 希望 返回 如 下 所 示 的 结果 集 。 

RNK SAL 

1 800 

2 950 

3 1100 

4 1250 

4 1250 

5 1300 

6 1500 

7 1600 

8 2450 

9 2850 

10 2975 

11 3000 

11 3000 

12 5000 
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2. 解决 方案 
窗口 函数 使 得 排序 操作 变 得 极其 简单 、 方 便 。 有 3 种 窗口 函数 对 于 排序 非常 有 用 : DENSE_ 
RANK OVER, ROW, NUMBER OVER 和 RANK OVER, 














DB2, Oracle 和 SQL Server 
因为 允许 Tie， 所 以 这 里 选择 了 窗口 函数 DENSE RANK OVER, 


1 select dense_rank() over(order by sal) rnk, sal 
2 from emp 





MySQL 和 PostgreSQL 
因为 不 支持 窗口 国 数 功能 ， 我 们 应 该 用 标量 子 查 询 来 对 工资 排序 。 





1 select (select count(distinct b.sal) 

2 from emp b 

3 where b.sal <= a.sal) as rnk, 
4 a.sal 

5 from emp a 


3. 讨论 

DB2. Oracle 和 SQL Server 

窗口 函数 DENSE_RANK OVER 完成 了 大 部 分 工作 。0VER 关键 字 后 面 的 括号 里 要 放 一 个 ORDER BY 
子 句 以 指定 用 于 排序 的 列 。 本 解决 方案 使 用 的 是 ORDER BY SAL， 因 此 EMP 表 是 按照 工资 递 
增 的 顺序 来 排序 的 。 

MySQL 和 PostgreSQL 

标量 子 查 询 的 输出 结果 类 似 于 DENSE_RANK 函数 ， 因 为 标量 子 查 询 是 基于 SAL JEJE VT L 
处 理 的 。 


11.10 ”删除 重复 项 


1. 问题 
你 想 找 出 EMP 表 里 不 同 的 职位 种 类 ， 但 又 不 希望 看 到 重复 项 。 结 果 集 应 该 如 下 所 示 。 
































ANALYST 
CLERK 
MANAGER 
PRESIDENT 
SALESMAN 


2. 解决 方案 

所 有 的 关系 数据 库 管 理 系统 都 支持 DISTINCT 关键 字 ， 并 且 它 也 是 从 结果 集中 删除 重复 项 的 
最 简单 的 方法 。 然 而 ， 本 实例 将 展示 另外 两 种 删除 重复 项 的 做 法 。 

DB2、Oracle 和 SQL Server 


传统 的 做 法 是 使 用 DISTINCT， 有 时 候 也 会 用 GROUP BY (正如 后 面 的 MySQL 和 PostgreSQL 
解决 方案 )， 这 些 方法 适用 于 所 有 的 关系 数据 库 管理 系统 。 下 面 给 出 的 替代 解决 方案 则 使 
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用 了 窗口 函数 ROW. NUMBER OVER, 


1 select job 

2 from ( 

3 select job, 

4 row_number()over(partition by job order by job) rn 
5 from emp 

6 )x 

7 


where rn=1 
MySQL 和 PostgreSQL 
使 用 DISTINCT 关键 字 从 结果 集 里 删除 重复 项 。 


select distinct job 
from emp 


另外 ， 志 可 以 通过 GROUP BY 达到 同样 目的 。 


select job 
from emp 
group by job 


3. 讨论 
DB2、Oracle 和 SQL Server 
本 解决 方案 展示 了 一 种 分 区 窗口 函数 (partitioned window function) 的 特殊 用 法 。 通 过 在 
OVER 子 句 里 使 用 PARTITION BY， 当 一 种 新 的 职位 出 现时 ，ROW_NUMBER 的 返回 值 会 被 重 置 为 
1。 内 艇 视图 X 的 结果 集 如 下 所 示 。 

select job, 


row number()over(partition by job order by job) rn 
from emp 





Tr 








T 


























ANALYST 
ANALYST 
CLERK 
CLERK 
CLERK 
CLERK 
MANAGER 
MANAGER 
MANAGER 
PRESIDENT 
SALESMAN 
SALESMAN 
SALESMAN 
SALESMAN 


每 一 行 都 被 分 配 了 一 个 递增 的 序号 ， 当 职位 种 类 发 生 改 变 时 ， 序 号 也 会 被 重 置 为 1。 为 了 
删除 重复 项 ， 我 们 需要 筛选 出 RN 等 于 1 的 那些 行 。 
使 用 ROW_NUMBER OVER 上 时， 必须 有 一 个 ORDER BY FAJ (DB2 除外 )， 但 这 并 不 影响 最 终结 


+ QO N PP F OONN F + QN PFE N P= 
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果 。 我 们 只 是 希望 提取 出 每 一 种 职位 ， 至 于 每 一 个 职位 来 自 哪 一 行 其 实 无 关 紧 要 。 
和 PostgreSQL 

一 种 解决 方案 展示 了 如 何 使 用 关键 字 DISTINCT 从 结果 集 里 删除 重复 项 。 需 要 注意 的 是 ， 
ne 会 对 整个 SELECT 列表 做 限制 ， 增 加 一 列 或 者 几 列 会 改变 最 终 的 结果 和 集 。 考 虑 下 面 
两 个 查询 的 差异 。 








select distinct job select distinct job, deptno 
from emp from emp 
JOB JOB DEPTNO 
ANALYST ANALYST 20 
CLERK CLERK 10 
MANAGER CLERK 20 
PRESIDENT CLERK 30 
SALESMAN MANAGER 10 
MANAGER 20 
MANAGER 30 
PRESIDENT 10 
SALESMAN 30 


向 SELECT 列表 里 增加 DEPTN0 列 的 话 ， 返 回 的 就 变 成 了 EMP 表 里 不 同 的 JOB/DEPTNO 组 合 值 。 


第 二 种 解决 方案 使 用 GROUP BY 删除 重复 项 ， 以 这 种 方式 使 用 GROUP BY 并 不 罕见 。 注 意 ， 
GROUP BY 和 DISTINCT 是 两 个 非常 不 同 的 子 句 ， 它 们 是 不 可 互 换 的 。 为 了 给 出 全 部 可 行 的 解 
决 方案 ， 我 特地 把 使 用 GROUP BY 去 掉 重 复 项 的 做 法 也 包含 进 了 本 实例 ， 这 样 读者 下 次 看 到 
类 似 做 法 时 就 不 会 有 什么 疑问 了 。 


11.11 查找 骑士 值 














1. 问题 
你 想 返回 一 个 结果 集 ， 其 中 包括 每 ee 
里 最 近 入 职 的 那个 员工 的 工资 。 你 希望 返回 如 下 所 示 的 结果 集 。 
DEPTNO ENAME SAL HIREDATE LATEST_SAL 
10 MILLER 1300 23-JAN-1982 1300 
10 KING 5000 17-NOV-1981 1300 
10 CLARK 2450 09-JUN-1981 1300 
20 ADAMS 1100 12-JAN-1983 1100 
20 SCOTT 3000 09-DEC-1982 1100 
20 FORD 3000 03-DEC-1981 1100 
20 JONES 2975 02-APR-1981 1100 
20 SMITH 800 17-DEC-1980 1100 
30 JAMES 950 03-DEC-1981 950 
30 MARTIN 1250 28-SEP-1981 950 
30 TURNER 1500 08-SEP-1981 950 
30 BLAKE 2850 01-MAY-1981 950 
30 WARD 1250 22-FEB-1981 950 
30 ALLEN 1600 20-FEB-1981 950 
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我 把 LATEST_SAL 值 称 作 “骑士 值 ”(knight value) ， 因 为 找 出 它们 的 方法 类 似 于 国际 象棋 游 
戏 中 骑士 的 路 径 。 我 们 找到 结果 的 方式 就 像 一 个 骑士 确定 新 位 置 : 跳 到 一 行 ， 然 后 转向 并 
跳 到 一 个 不 同 的 列 (图 11-1)。 为 找到 正确 的 LATEST SAL 值 ， 你 必须 先 定 位 〈 跳 到 ) 每 个 
DEPTNO 对 应 的 最 新 HIREDATE， 然 后 选择 〈 跳 到 ) 那 一 行 的 SAL 列 。 





DEPTNO ENAME b HIREDATE LA TEST. SAL 





m Cg 
mw 


" Ix I =- I i 




















图 11-1: 骑士 值 来 源 于 国际 象棋 中 骑士 的 走 法 
e “骑士 值 ”是 由 我 的 一 个 非常 聪明 的 同事 Kay Young 创造 出 来 的 。 在 他 帮 有 我 
心 做 完 正确 性 检查 后 ， 我 告诉 他 我 被 难 住 了 ， 因 为 无 法 为 本 实例 想 出 一 个 恰 到 
us 好 处 的 标题 。 考 虑 到 需要 先 对 当前 行 数据 做 出 评估 ， 然 后 “ 跳 ” 到 另外 一 行 
并 取出 某 列 的 值 ， 于 是 他 提出 了 “骑士 值 ”这 个 名 词 。 


2. 解决 方案 

DB2 和 SQL Server 

在 子 查询 中 使 用 CASE 表达 式 ， 并 返回 每 个 DEPTNO 对 应 的 最 近 入 职 的 那个 员工 的 SAL; 对 
于 其 他 工资 值 ， 则 返回 0。 在 外 层 的 查询 中 使 用 窗口 函数 MAX OVER 为 每 个 员工 的 部 门 返 回 
非 零 的 SAL, 











1 select deptno， 

2 ename, 

3 sal, 

4 hiredate, 

5 max(latest sal)over(partition by deptno) latest sal 
6 from (人 

7 select deptno, 

8 ename, 

9 sal, 

10 hiredate, 

11 case 

12 when hiredate - max(hiredate)over(partition by deptno) 
13 then sal else 0 

14 end latest sal 

15 from emp 

16 )x 


17 order by 1, 4 desc 
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MySQL 和 PostgreSQL 
使 用 两 层 侍 套 的 标量 子 查询 。 首 先 ， 找 出 每 个 DEPTO 对 应 的 最 近 入 职 的 员工 的 HIREDATE。 
然后 使 用 聚合 函数 MAX (如 果 有 重复 项 ) 找 出 每 个 DEPTNO 对 应 的 最 近 入 职 的 员工 的 SAL, 











1 select e.deptno, 

2 e.ename, 

3 e.sal, 

4 e.hiredate, 

5 (select max(d.sal) 

6 from emp d 

7 where d.deptno = e.deptno 

8 and d.hiredate - 

9 (select max(f.hiredate) 
10 from emp f 

11 where f.deptno - e.deptno)) as latest sal 
12 from emp e 


13 order by 1, 4 desc 





使 用 窗口 函数 MAX OVER 返回 每 个 DEPTNO 对 应 的 最 高 SAL (É. E KEEP 子 句 中 使 用 函数 


DENSE_RANK 和 LAST， 并 按照 HIREDATE 排序 ， 为 给 定 DEPTNO 对 应 的 最 新 HIREDATE 返回 最 高 
的 SAL 值 。 





























1 select deptno， 

2 ename, 

3 sal, 

4 hiredate, 

5 max(sal) 

6 keep(dense_rank last order by hiredate) 
7 over(partition by deptno) latest sal 

8 from emp 

9 order by 1, 4 desc 


3. 讨论 

DB2 和 SQL Server 

首先 在 CASE 表达 式 中 使 用 窗口 函数 MAX OVER 找 出 每 个 DEPTNO 对 应 的 最 近 入 职 的 员工 。 如 
果 员 工 的 HIREDATE 等 于 MAX OVER 的 返回 值 ， 那 么 CASE 表达 式 就 会 返回 该 员工 的 SAL fé ; 
人 否则， 返回 0。 这 一 步 的 结果 如 下 所 示 。 


select deptno, 

ename， 

sal, 

hiredate, 

case 
when hiredate = max(hiredate)over(partition by deptno) 
then sal else 0 

end latest sal 


























from emp 
DEPTNO ENAME SAL HIREDATE LATEST SAL 
10 CLARK 2450 09-JUN-1981 0 
10 KING 5000 17-NOV-1981 0 





10 
20 
20 
20 
20 
20 
30 
30 
30 
30 
30 
30 


MILLER 
SMITH 
ADAMS 
FORD 
SCOTT 
JONES 
ALLEN 
BLAKE 
MARTIN 
JAMES 
TURNER 
WARD 


1300 

800 
1100 
3000 
3000 
2975 
1600 
2850 
1250 

950 
1500 
1250 


23-JAN-1982 
17-DEC-1980 
12-JAN-1983 
03-DEC-1981 
09-DEC-1982 
02-APR-1981 
20-FEB-1981 
01-MAY-1981 
28-SEP-1981 
03-DEC-1981 
08-SEP-1981 
22-FEB-1981 


LATEST SAL 值 要 么 是 0， 要 么 是 最 近 入 职 的 员工 的 SAL, 


个 内 嵌 视 图 ， 并 在 此 基础 上 再 次 使 月 





LATEST_SAL, 


select 


from 
select 


from 
order 


DEPTNO 








deptno, 
ename, 
sal, 
hiredate, 








因此 我 们 可 以 把 上 述 查询 作为 一 


max(latest sal)over(partition by deptno) latest sal 


( 
deptno, 
ename, 
sal, 
hiredate, 
case 
when hiredate 
then sal else 
end latest sal 
emp 
)x 
by 1, 4 desc 


= max(hiredate)over(partition by deptno) 


0 


HIREDATE 


LATEST SAL 


MILLER 
KING 
CLARK 
ADAMS 
SCOTT 
FORD 
JONES 
SMITH 
JAMES 
MARTIN 
TURNER 
BLAKE 
WARD 
ALLEN 


MySQL 和 PostgreSQL 
首先 ， 使 用 标量 子 查询 找 出 每 个 DEPTNO 对 应 的 最 新 入 职 的 员工 的 HIREDATE, 





23-JAN-1982 
17-NOV-1981 
09-JUN-1981 
12-JAN-1983 
09-DEC-1982 
03-DEC-1981 
02-APR-1981 
17-DEC-1980 
03-DEC-1981 
28-SEP-1981 
08-SEP-1981 
01-MAY-1981 
22-FEB-1981 
20-FEB-1981 


H MAX OVER， 这 次 我 们 要 为 每 个 DEPTN0 返回 最 大 的 非 零 
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然后 


select e.deptno, 
e.ename, 
e.sal, 
e.hiredate, 
(select max(f.hiredate) 
from emp f 
where f.deptno - e.deptno) as last hire 
from emp e 
order by 1, 4 desc 


DEPTNO ENAME SAL HIREDATE LAST HIRE 
10 MILLER 1300 23-JAN-1982 23-JAN-1982 
10 KING 5000 17-NOV-1981 23-JAN-1982 
10 CLARK 2450 09-JUN-1981 23-JAN-1982 
20 ADAMS 1100 12-JAN-1983 12-JAN-1983 
20 SCOTT 3000 09-DEC-1982 12-JAN-1983 
20 FORD 3000 03-DEC-1981 12-JAN-1983 
20 JONES 2975 02-APR-1981 12-JAN-1983 
20 SMITH 800 17-DEC-1980 12-JAN-1983 
30 JAMES 950 03-DEC-1981 03-DEC-1981 
30 MARTIN 1250 28-SEP-1981 03-DEC-1981 
30 TURNER 1500 08-SEP-1981 03-DEC-1981 
30 BLAKE 2850 01-MAY-1981 03-DEC-1981 
30 WARD 1250 22-FEB-1981 03-DEC-1981 
30 ALLEN 1600 20-FEB-1981 03-DEC-1981 








， 找 出 每 个 DEPTNO 对 应 的 入 职 日 期 等 于 LAST. HIRE 的 员工 的 SAL。 使 月 


找 出 最 大 值 (如 果 同 一 天 入 职 的 员工 不 止 一 人 的 话 )。 


select e.deptno, 
e.ename, 
e.sal, 
e.hiredate, 
(select max(d.sal) 
from emp d 
where d.deptno = e.deptno 
and d.hiredate - 
(select max(f.hiredate) 
from emp f 
where f.deptno - e.deptno)) as latest sal 
from emp e 
order by 1, 4 desc 


DEPTNO ENAME SAL HIREDATE LATEST SAL 
10 MILLER 1300 23-JAN-1982 1300 
10 KING 5000 17-NOV-1981 1300 
10 CLARK 2450 09-JUN-1981 1300 
20 ADAMS 1100 12-JAN-1983 1100 
20 SCOTT 3000 09-DEC-1982 1100 
20 FORD 3000 03-DEC-1981 1100 
20 JONES 2975 02-APR-1981 1100 
20 SMITH 800 17-DEC-1980 1100 
30 JAMES 950 03-DEC-1981 950 
30 MARTIN 1250 28-SEP-1981 950 
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30 TURNER 
30 BLAKE 
30 WARD 

30 ALLEN 


Oracle 


1500 08-SEP-1981 950 
2850 01-MAY-1981 950 
1250 22-FEB-1981 950 
1600 20-FEB-1981 950 








Oracle 8i FH PANI; HI Bi 18 








i) DB2 解决 方案 。Oracle 9i 及 后 续 版 本 则 可 以 使 用 下 








看 给 出 的 














解决 方案 。 如 下 Oracle 解决 方案 的 关键 在 于 利用 KEP F, KEP 子 句 为 分 组 或 者 分 区 之 
后 的 行 数据 进行 排序 ， 并 取出 每 组 的 第 一 行 或 最 后 一 行 。 试 想 一 下 ， 去 掉 了 KEEP 子 名 的 解 


决 方案 会 如 何 。 


select deptno, 
ename, 
sal, 
hiredate, 





max(sal) over(partition by deptno) latest sal 


from emp 
order by 1, 4 desc 


DEPTNO ENAME 
10 MILLER 
10 KING 
10 CLARK 
20 ADAMS 
20 SCOTT 
20 FORD 
20 JONES 
20 SMITH 
30 JAMES 
30 MARTIN 
30 TURNER 
30 BLAKE 
30 WARD 
30 ALLEN 


SAL HIREDATE LATEST SAL 


1300 23-JAN-1982 5000 
5000 17-NOV-1981 5000 
2450 09-JUN-1981 5000 
1100 12-JAN-1983 3000 
3000 09-DEC-1982 3000 
3000 03-DEC-1981 3000 
2975 02-APR-1981 3000 
800 17-DEC-1980 3000 
950 03-DEC-1981 2850 
1250 28-SEP-1981 2850 
1500 08-SEP-1981 2850 
2850 01-MAY-1981 2850 
1250 22-FEB-1981 2850 
1600 20-FEB-1981 2850 








去 掉 了 KEEP 子 句 的 MAX OVER 只 会 简单 地 返回 每 个 DEPTNO 对 应 的 最 高 工资 值 ， 而 不 是 最 近 
入 职 的 那个 员工 的 SAL。 这 里 的 KEEP 子 句 通过 指定 ORDER BY HIREDATE 按照 HIREDATE 为 每 
个 DEPTNO 对 应 的 工资 值 进行 排序 。 然 后 ，DENSE_RANK 函数 按照 升序 为 HIREDATE 排序 。 最 
Ju, ERR LAST 决定 针对 哪 一 行 记 录 使 用 聚合 国 数 : 基于 DENSE_RANK 排序 最 后 的 一 行 。 对 
本 例 而 言 ， 聚 合 国 数 MAX 针对 的 是 最 后 一 行 HIREDATE 所 对 应 的 SAL 列 。 其 实 就 是 为 了 保留 
每 个 DEPTN0 对 应 的 HIREDATE 排序 最 后 的 那个 SAL 值 。 


我 们 基于 某 一 列 (HIREDATE) 为 每 个 DEPTNO 对 应 的 行 做 排序 ， 却 针对 另 一 列 (SAL) 做 聚 


合计 算 (MAX), Oracle 具备 的 这 种 先 针对 某 一 个 维度 做 排序 ， 继 而 又 名 
































F 对 另 一 个 维度 做 聚 


合计 算 的 能 力 非 党 有用， 其 他 数据 库 需 要 额外 的 连接 查询 和 内 舱 视 图 才能 达到 同样 的 效 
句 后面 跟 一 个 OVER 子 句 ， 我 们 就 能 返回 由 KEEP 子 句 为 每 一 行 


果 。 最 后 ， 通 过 在 KEEP 子 
“保留 ”下 来 的 SAL 值 。 















































另外 ， 我 们 还 可 以 对 HIREDATE 实行 降序 排列 ， 并 保留 第 一 个 SAL 值 。 比 较 下 面 的 两 个 查 
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询 ， 它 们 都 返回 相同 的 结果 集 。 








select deptno, 
ename, 
sal, 
hiredate, 
max(sal) 
keep(dense rank last order by hiredate) 
over(partition by deptno) latest sal 
from emp 
order by 1, 4 desc 
DEPTNO ENAME SAL HIREDATE LATEST SAL 
10 MILLER 1300 23-JAN-1982 1300 
10 KING 5000 17-NOV-1981 1300 
10 CLARK 2450 09-JUN-1981 1300 
20 ADAMS 1100 12-JAN-1983 1100 
20 SCOTT 3000 09-DEC-1982 1100 
20 FORD 3000 03-DEC-1981 1100 
20 JONES 2975 02-APR-1981 1100 
20 SMITH 800 17-DEC-1980 1100 
30 JAMES 950 03-DEC-1981 950 
30 MARTIN 1250 28-SEP-1981 950 
30 TURNER 1500 08-SEP-1981 950 
30 BLAKE 2850 01-MAY-1981 950 
30 WARD 1250 22-FEB-1981 950 
30 ALLEN 1600 20-FEB-1981 950 
select deptno, 
ename, 
sal, 
hiredate, 
max(sal) 
keep(dense rank first order by hiredate desc) 
over(partition by deptno) latest sal 
from emp 
order by 1, 4 desc 
DEPTNO ENAME SAL HIREDATE LATEST SAL 
10 MILLER 1300 23-JAN-1982 1300 
10 KING 5000 17-NOV-1981 1300 
10 CLARK 2450 09-JUN-1981 1300 
20 ADAMS 1100 12-JAN-1983 1100 
20 SCOTT 3000 09-DEC-1982 1100 
20 FORD 3000 03-DEC-1981 1100 
20 JONES 2975 02-APR-1981 1100 
20 SMITH 800 17-DEC-1980 1100 
30 JAMES 950 03-DEC-1981 950 
30 MARTIN 1250 28-SEP-1981 950 
30 TURNER 1500 08-SEP-1981 950 
30 BLAKE 2850 01-MAY-1981 950 
30 WARD 1250 22-FEB-1981 950 
30 ALLEN 1600 20-FEB-1981 950 
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11.12 生成 简单 的 预测 


1. 问题 
基于 当前 数据 ， 你 想得到 代表 未 来 行为 的 、 额 外 的 行 和 列 。 例 如 ， 考 虑 下 面 的 结果 集 。 


ID ORDER_DATE PROCESS_DATE 


5-SEP-2005 27-SEP-2005 
6-SEP-2005 28-SEP-2005 
7-SEP-2005 29-SEP-2005 


对 于 上 述 结果 集 里 的 每 一 行 ， 你 希望 返回 三 行 数据 (对 每 一 份 订 单 ， 在 现 有 数据 行 的 基础 
上 额外 加 上 两 行 数据 )。 此 外 ， 在 这 些 额 外 的 行 里 ， 你 希望 增加 两 列 以 展示 预期 的 订单 处 
理 日 期 。 


根据 上 面 提供 的 结果 集 ， 我 们 可 以 看 到 一 个 订单 的 处 理 需 要 花费 两 天 时 间 。 假 设 订单 处 理 
完成 后 ， 下 一 步 要 做 订单 核查 ， 最 后 一 步 则 是 发 货 。 核 查 发 生 在 订单 处 理 后 一 天 ， 发 货 则 
是 在 核查 后 一 天 。 你 希望 得 到 一 个 能 展示 整个 过 程 的 结果 集 。 最 终 是 要 把 上 面 的 结果 集 变 
换 为 如 下 所 示 的 结果 集 。 


ID ORDER_DATE PROCESS_DATE VERIFIED SHIPPED 

















Lu N P> 
NNN 













































































25-SEP-2005 27-SEP-2005 28-SEP-2005 
25-SEP-2005 27-SEP-2005 28-SEP-2005 29-SEP-2005 


-2005 
26-SEP-2005 28-SEP-2005 29-SEP-2005 30-SEP-2005 


27-SEP-2005 29-SEP-2005 30-SEP-2005 
27-SEP-2005 29-SEP-2005 30-SEP-2005 01-OCT-2005 


2. 解决 方案 
关键 在 于 借助 笛 卡 儿 积 为 每 一 个 订单 生成 额外 的 两 行 数 据 ， 然 后 只 需 使 用 CASE 表达 式 生 成 
所 需 的 列 值 即 可 。 


DB2 和 SQL Server 

使 用 WITH 递归 查询 为 笛 卡 儿 积 产生 所 需 数目 的 行 。DB2 和 SQL Server 的 解决 方案 几乎 完 
全 一 样 ， 除 了 获取 当前 日 期 的 函数 不 同 。DB2 调用 CURRENT. DATE 函数 ， 而 SQL Server 使 
用 GETDATE 函数 。 下 面 展示 了 SQL Server 的 解决 方案 。 


1 with nrows(n) as ( 
2 select 1 from tl union all 
3 select n+1 from nrows where n+1 <= 3 
4) 
5 select id, 
order_date, 
process_date, 
case when nrows.n >= 2 
then process_date+1 
else null 


UJ UJ UU N N N PF PF P= 
N 
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[^4] 
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= 
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11 end as verified, 


12 case when nrows.n = 3 

13 then process_date+2 

14 else null 

15 end as shipped 

16 from ( 

17 select nrows.n id, 

18 getdate()+nrows.n as order_date, 
19 getdate()+nrows.n+2 as process_date 
20 from nrows 

21 ) orders, nrows 


22 order by 1 


Oracle 
使 用 CONNECT BY 子 句 生成 笛 卡 儿 积 所 需 的 3 行 数据 。 使 用 WITH 子 句 ， 这 样 我 们 就 可 以 重新 
使 用 由 CONNECT BY 返回 的 结果 集 ， 而 不 必 再 次 调用 它 。 


1 with nrows as ( 
2 select level n 
from dual 
connect by level <= 3 


4 
5 ) 

6 select id, 
7 

8 

9 























w 


order_date, 
process_date, 
case when nrows.n >= 2 


10 then process_date+1 
11 else null 
12 end as verified, 
13 case when nrows.n = 3 
14 then process_date+2 
15 else null 
16 end as shipped 
17 from ( 
18 select nrows.n id, 
19 sysdate+nrows.n as order_date, 
20 sysdate+nrows.n+2 as process_date 
21 from nrows 
22 ) orders, nrows 
PostgreSQL 


可 以 通过 很 多 种 不 同 的 方式 创建 笛 卡 儿 积 ， 本 解决 方案 用 到 了 PostgreSQL 的 GENERATE 
SERIES 国 数 。 


1 select id, 

2 order_date, 

3 process_date, 

4 case when gs.n >= 2 

5 then process_date+1 
6 else null 

7 end as verified, 

8 case when gs.n = 3 

9 then process_date+2 
10 else null 
































11 end as shipped 
12 from ( 
13 select gs.id, 
14 current datesgs.id as order date, 
15 current date4gs.id«2 as process date 
16 from generate series(1,3) gs (id) 
17 ) orders, 
18 generate series(1,3)gs(n) 
MySQL 
MySQL 不 支持 自动 生成 行 数据 的 函数 。 
3. 讨论 
DB2 和 SQL Server 
“问题 ”部 分 提供 的 结果 集 来 自 内 租 视 图 ORDERS， 如 下 所 示 。 








with nrows(n) as ( 
select 1 from t1 union all 
select n+1 from nrows where n+1 <= 3 


) 
select nrows.n id, 
getdate()+nrows.n as order_date, 
getdate()+nrows.n+2 as process_date 
from nrows 


ID ORDER_DATE PROCESS_DATE 


5-SEP-2005 27-SEP-2005 
6-SEP-2005 28-SEP-2005 
7-SEP-2005 29-SEP-2005 


上 面 的 查询 使 用 WITH 子 句 生成 了 3 钙 
个 数字 : 
单 的 ORDER_DATE。 
面 的 查 
再 加 上 2 天 )。 


Q Ne 
NNN 




















因为 前 面 在 “ 



































现在 我 们 已 经 得 到 了 浊 


with nrows(n) as ( 
select 1 from t1 union all 
select n«1 from nrows where n+1 <= 3 
) 
select nrows.n, 
orders.* 
from ( 
select nrows.n id, 
getdate()4«nrows.n as order date, 
getdate()4nrows.n*2 as process date 
from nrows 
) orders, nrows 


行 数据 ， 代 表 了 我 们 要 处 理 的 订单 。NROWS 返回 了 3 
1、2、3， 这 些 数 字 和 GETDATE (DB2 则 是 CURRENT_DATE) 相 加 就 得 到 了 这 些 订 
问题 ”部 分 里 说 过 订单 处 理 需 要 花费 2 天 时 间 ， 于 是 上 
询 也 在 ORDER DATE 的 基础 上 增加 了 2 天 (将 NROWS 的 返回 值 加 入 GETDATE， 








然后 


基础 结果 集 ， 下 一 步 是 产生 一 个 笛 卡 儿 积 ， 因 为 需要 为 每 个 订单 返 
3 行 数 据 。 使 用 NROWS 产生 笛 卡 儿 积 ， 为 每 个 订单 返 





E 3 行 数据 。 
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现在 每 个 J 


order by 2,1 


N ID ORDER_DATE 
25-SEP-2005 
25-SEP-2005 
25-SEP-2005 
26-SEP-2005 
26-SEP-2005 
26-SEP-2005 
27-SEP-2005 
27-SEP-2005 
27-SEP-2005 


Q N PPF QQ N F Q N P 
Q UU N N N PF P P= 





PROCESS_DATE 
27-SEP-2005 
27-SEP-2005 
27-SEP-2005 
28-SEP-2005 
28-SEP-2005 
28-SEP-2005 
29-SEP-2005 
29-SEP-2005 
29-SEP-2005 





都 有 了 3 行 记 录 ， 然 后 只 要 用 CASE 表达 式 生 成 额外 的 列 值 即 可 ， 


了 订单 核查 和 发 货 的 状态 。 
每 个 订单 的 第 一 行 记 录 里 VERIFIED 和 SHIPPED d Null, oo SHIPPED 应 该 为 


NULL。 


第 三 行 的 VERIFIED 和 SHIPPED 都 应 该 是 非 Null 值 。 


with nrows(n) as ( 


select 1 from t1 union all 
select n«1 from nrows where n+1 <= 3 


) 


select id, 
order date, 


process date, 


case when nrows.n »- 2 
then process date«1 
else null 

end as verified, 

case when nrows.n = 3 
then process dates2 
else null 

end as shipped 


from ( 
select nrows.n id, 


getdate()«nrows.n as order date, 
getdate()+nrows .n+2 as process date 


from nrows 


) orders, nrows 


order by 1 


ID ORDER DATE PROCESS DATE VERIFIED SHIPPED 


25-SEP-2005 27-SEP-2005 
25-SEP-2005 27-SEP-2005 28-SEP-2005 
25-SEP-2005 27-SEP-2005 28-SEP-2005 29-SEP-2005 


26-SEP-2005 28-SEP-2005 29-SEP-2005 
26-SEP-2005 28-SEP-2005 29-SEP-2005 30-SEP-2005 


1 
1 
1 
2 26-SEP-2005 28-SEP-2005 
2 
2 
3 


27-SEP-2005 29-SEP-2005 


这 些 列 代表 


的 结果 集 如 下 所 示 。 





-SEP-2005 29-SEP-2005 30-SEP-2005 
-SEP-2005 29-SEP-2005 30-SEP-2005 01-OCT-2005 


最 终 的 结果 集 展示 了 从 收 到 订单 直至 发 货 为 止 的 订单 处 理 全 过 程 。 





Oracle 





“问题 ”部 分 里 的 结果 集 是 由 内 骨 视 图 ORDERS 生成 的 ， 如 下 所 示 。 





with nrows as ( 
select level n 
from dual 
connect by level <= 3 
) 
select nrows.n id, 
sysdate+nrows.n order_date, 
sysdate+nrows.n+2 process_date 
from nrows 


ID ORDER_DATE PROCESS_DATE 


5-SEP-2005 27-SEP-2005 
6-SEP-2005 28-SEP-2005 
7-SEP-2005 29-SEP-2005 


上 述 查 询 借助 CONNECT BY 生成 我 们 要 处 理 的 3 行 订单 数据 。 


Q N HG 
NNN 






































的 查询 也 为 ORDER. DATE 加 上 了 2 天 (把 CONNECT BY 的 返回 
两 天 ) ° 











使 用 WITH 子 名 参照 CONNECT 
BY 返回 的 行 数据 NROWS .N, CONNECT BY 返回 了 数字 1、2 和 3， 这 些 数字 分 别 加 上 SYSDATE 
后 得 到 的 结果 即 是 ORDER_DATE。“ 问 题 ” 部 分 里 提 到 ， 订 单 处 理 需 要 两 天 时 间 ， 
值 和 SYSDATE 相 加 后 ， 再 加 上 





因此 上 面 




















现在 得 到 了 基础 结果 集 ， 下 一 步 是 产生 一 个 笛 卡 儿 积 ， 因 为 本 问题 要 求 为 每 个 订单 返回 3 
行 数据 。 使 用 NROWS 产生 笛 卡 儿 积 并 为 每 个 订单 返回 3 行 记录 。 
with nrows as ( 
select level n 
from dual 
connect by level <= 3 
) 
select nrows.n, 
orders.* 
from ( 
select nrows.n id, 
sysdate+nrows.n order_date, 
sysdate+nrows.n+2 process_date 
from nrows 
) orders, nrows 
N ID ORDER_DATE PROCESS_DATE 
1 1 25-SEP-2005 27-SEP-2005 
2 1 25-SEP-2005 27-SEP-2005 
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QN PPF UJ NJ HÓ UJ 
UJ UJ UJ N N N P 


25-SEP-2005 27-SEP-2005 
26-SEP-2005 28-SEP-2005 
26-SEP-2005 28-SEP-2005 
26-SEP-2005 28-SEP-2005 
27-SEP-2005 29-SEP-2005 
27-SEP-2005 29-SEP-2005 
27-SEP-2005 29-SEP-2005 





现在 每 个 订单 都 有 了 3 行 数据 ， 接 下 来 只 要 使 用 CASE 表达 式 生成 额外 的 列 值 即 可 ， 这 些 列 








代表 了 订单 核查 和 发 货 的 状态 。 


每 个 订单 的 第 一 行 记 录 里 VERIFIED 和 SHIPPED 应 该 是 NuLL。 第 二 行 的 SHIPPED 应 该 为 
NuLL。 第 三 行 的 VERIFIED 和 SHIPPED 都 应 该 是 非 Null 值 。 最 终 的 结果 集 如 下 所 示 。 





with nrows as ( 
select level n 
from dual 

connect by level <= 3 

) 

select id, 
order_date, 
process_date, 
case when nrows.n >= 


2 


then process_date+1 


else null 
end as verified, 


case when nrows.n = 3 


then process_date+2 


else null 
end as shipped 
from ( 
select nrows.n id, 


sysdate+nrows.n order_date, 
sysdate+nrows.n+2 process_date 


from nrows 
) orders, nrows 


ID ORDER_DATE PROCESS_DATE 
25-SEP-2005 27-SEP-2005 
25-SEP-2005 27-SEP-2005 
25-SEP-2005 27-SEP-2005 
26-SEP-2005 28-SEP-2005 
26-SEP-2005 28-SEP-2005 
26-SEP-2005 28-SEP-2005 
27-SEP-2005 29-SEP-2005 
27-SEP-2005 29-SEP-2005 
27-SEP-2005 29-SEP-2005 


UJ UU UU l2 N N F HH 

















最 终 的 结果 集 展 示 了 从 收 到 订单 直至 发 货 为 止 的 订单 处 理 全 过 程 。 





PostgreSQL 

















VERIFIED SHIPPED 


28-SEP-2005 
28-SEP-2005 29-SEP-2005 


29-SEP-2005 
29-SEP-2005 30-SEP-2005 


30-SEP-2005 
30-SEP-2005 01-OCT-2005 





























“问题 ”部 分 里 的 结果 集 是 由 内 上 租 视图 ORDERS 生成 的 ， 如 下 所 示 。 











select gs.id, 
current datesgs.id as order date, 
current date4gs.id42 as process date 
from generate series(1,3) gs (id) 


ID ORDER DATE PROCESS DATE 
5-SEP-2005 27-SEP-2005 
6-SEP-2005 28-SEP-2005 
7-SEP-2005 29-SEP-2005 


上 述 查 询 使 用 GENERATE SERIES 函数 生成 了 我 们 要 处 理 的 3 行 订 单数 据 。GENERATE_SERIES 
返回 了 数字 1、2 和 3， 并 把 这 些 数字 和 CURRENT. DATE 相 加 得 到 ORDER_DATE。“ 问 题 ” 部 
分 里 提 到 ， 订 单 处 理 需 要 2 天 时 间 ， 因 此 上 面 的 查询 也 为 ORDER DATE 加 上 了 2 天 (把 
GENERATE, SERIES 的 返回 值 和 CURRENT. DATE 相 加 ， 然 后 再 加 上 两 天 ) 。 


现在 我 们 得 到 了 基础 结果 集 ， 下 一 步 是 产生 一 个 笛 卡 儿 积 ， 因 为 本 问题 要 求 为 每 个 订单 返 
El 3 行 数 据 。 使 用 GENERATE SERIES 函数 产生 一 个 笛 卡 儿 积 并 为 每 个 订单 返回 3 行 记录 。 


select gs.n， 
orders.* 
from ( 
select gs.id, 
current datesgs.id as order date, 
current date4gs.id«2 as process date 
from generate series(1,3) gs (id) 
) orders, 
generate series(1,3)gs(n) 


W Ne 
NNN 









































N ID ORDER_DATE PROCESS_DATE 
25-SEP-2005 27-SEP-2005 
25-SEP-2005 27-SEP-2005 
25-SEP-2005 27-SEP-2005 
26-SEP-2005 28-SEP-2005 
26-SEP-2005 28-SEP-2005 
26-SEP-2005 28-SEP-2005 
27-SEP-2005 29-SEP-2005 
27-SEP-2005 29-SEP-2005 
27-SEP-2005 29-SEP-2005 


现在 每 个 顺序 都 拥有 了 3 行 ， 然 后 简单 地 用 一 个 CASE 表达 式 创建 需要 增加 的 列 值 ， 这 些 列 
代表 了 核查 和 装运 的 状态 。 


每 个 订单 的 第 一 行 记录 里 VERIFIED 和 SHIPPED 应 该 是 NtL。 第 二 行 的 SHIPPED 应 该 为 
NuLL。 第 三 行 的 VERIFIED 和 SHIPPED 都 应 该 是 非 空 值 。 最 终 的 结果 集 如 下 所 示 。 


select id, 
order_date, 
process_date, 
case when gs.n >= 2 


Q N PPF QON F Q N P 
Q UU) I2 N N PFE PF P> 
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最 终 的 结果 集 展 示 了 从 收 到 订单 直至 发 货 为 止 的 订单 处 理 全 过 程 


then process_date+1 


else null 
end as verified, 
case when gs.n = 3 


then process_date+2 


else null 
end as shipped 
from ( 
select gs.id, 
current date-sgs.id 
current datesgs.id«2 
from generate series(1,3) 
) orders, 


as order date, 
as process date 
gs(id) 


generate series(1,3)gs(n) 


ID ORDER DATE PROCESS DATE 
25-SEP-2005 27-SEP-2005 
25-SEP-2005 27-SEP-2005 
25-SEP-2005 27-SEP-2005 
26-SEP-2005 28-SEP-2005 
26-SEP-2005 28-SEP-2005 
26-SEP-2005 28-SEP-2005 
27-SEP-2005 29-SEP-2005 
27-SEP-2005 29-SEP-2005 
27-SEP-2005 29-SEP-2005 


UJ UU UU l2 l2 N F PF. P> 




















VERIFIED SHIPPED 


28-SEP-2005 
28-SEP-2005 29-SEP-2005 


29-SEP-2005 
29-SEP-2005 30-SEP-2005 


30-SEP-2005 
30-SEP-2005 01-OCT-2005 




















T 














第 12 章 





报表 和 数据 仓库 


本 章 介绍 了 一 些 创建 报表 的 实例 。 这 些 实例 多 数 都 与 报表 格式 化 和 不 同 级 别 的 聚合 运算 相 
关 。 本 章 另 一 部 分 重要 的 内 容 是 结果 集 变 换 ， 例 如 ， 把 行 形式 的 数据 转换 为 列 形式 。 很 多 








时 候 ， 结 果 集 变换 都 非常 有 用 。 你 车 能 深入 理解 并 熟练 掌握 该 技巧 ， 必 能 在 实际 工作 中 举 








一 反 三 ， 发 现 其 更 多 的 用 武之 地 。 


12.1 变换 结果 集成 一 行 
1. 问题 








你 想 把 若干 行 数据 重新 组 合成 一 行 新 数据 ， 原 始 数 据 集 的 每 一 行 变换 后 会 作为 新 数据 的 一 











列 出 现 。 例 如 ， 下 面 的 结果 集 展示 了 每 个 部 门 的 员工 人 数 。 











DEPTNO CNT 
10 3 
20 5 
30 6 















































你 希望 把 上 述 结果 集 重 新 格式 化 成 下 面 的 输出 结果 。 








DEPTNO 10 DEPTNO_20 DEPTNO_30 


2. 解决 方案 
使 用 CASE 表达 式 和 聚合 国 数 SUM 实现 结果 集 变 换 。 





1 select sum(case when deptno-10 then 1 else 0 end) as deptno 10, 
2 sum(case when deptno-20 then 1 else 0 end) as deptno 20, 
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3 sum(case when deptno=30 then 1 else 0 end) as deptno_30 


4 from emp 
3. 讨论 
这 是 一 个 非常 好 的 结果 集 变 换 入 门 实例 。 





它 的 做 法 其 

















作 原 理 ， 那 么 不 妨 先 执行 下 面 的 查询 ， 该 查询 调用 聚 


可 读 性 。 


select deptno, 


实 很 简单 : 对 于 每 一 行 的 原始 数据 ， 
使 用 CASE 表达 式 把 行 变 换 成 列 。 然 后 ， 由 于 本 实例 要 合计 每 个 部 门 的 员工 人 数 ， 
调用 聚合 函数 SUM 计算 出 每 个 DEPTN0 出 现 的 次 数 。 pe 



































case when deptno-10 then 1 else 0 end as deptno 10, 
case when deptno-20 then 1 else 0 end as deptno 20, 
case when deptno-30 then 1 else 0 end as deptno 30 


from emp 
order by 1 


DEPTNO DEPTNO 10 DEPTNO 20 DEPTNO. 


N 

© 
OOococococoocooocomnomnna 
OoocococooonbnnBnmnbBn5booo 


30 


BR HBOHLBHHHBboOoccococcGoocosoco 








因此 需要 


解 以 上 解决 方案 的 工 
国 数 SUM， 并 加 上 了 pEPTNO 以 增强 





我 们 可 以 把 每 pu. 大 式 的 结果 值 想 象 成 一 个 标志 位 ， 它 表示 每 个 DEPTN0 属于 哪 
一 行 。 至此,“ 把 行 变 成 列 ” 的 操作 已 经 完成 。 下 一 步 只 要 合计 DEPTNO 10, DEPTNO 20 和 
DEPTNO 30 的 值 ， 并 按照 pEPTNO 分 组 即 可 ， 结 果 集 显示 如 下 。 





select deptno, 


sum(case when deptno-10 then 1 else 0 end) as deptno 10, 
sum(case when deptno-20 then 1 else 0 end) as deptno 20, 
sum(case when deptno-30 then 1 else 0 end) as deptno 30 


from emp 
group by deptno 


DEPTNO DEPTNO 10 DEPTNO 20 DEPTNO_ 


10 3 0 
20 0 5 
30 0 0 


30 




















逻辑 上 是 正确 的 。 例 如 ，DEPTN0 等 于 




















10 的 部 门 对 应 的 行 里 面 ，DEPTN0_16 的 值 为 3， 而 其 他 列 都 是 0。 因 为 我 们 的 目标 是 只 返 

回 一 行 数 据 ， 最 后 一 步 就 是 要 舍弃 DEPTNO 和 GROUP BY， 只 针对 CASE 表达 式 的 结果 执行 SUM 
select sum(case when deptno=10 then 1 else 0 end) as deptno 10, 
sum(case when deptno-20 then 1 else 0 end) as deptno 20, 


sum(case when deptno-30 then 1 else 0 end) as deptno. 30 
from emp 





DEPTNO 10 DEPTNO 20 DEPTNO_30 


对 于 这 一 类 问题 ， 还 有 一 种 可 能 的 做 法 。 


select max(case when deptno-10 then empcount else null end) as deptno 10, 
max(case when deptno-20 then empcount else null end) as deptno 20, 
max(case when deptno-30 then empcount else null end) as deptno 30 

from ( 

select deptno, count(*) as empcount 

from emp 
group by deptno 
)x 


-EXxS25 RUNI MS] HE p E 180] DALLAS AC, ESTERI LER] CASE 表达 式 把 行 转换 成 列 ， 
将 得 到 下 面 的 结果 。 
DEPTNO 10 DEPTNO 20 DEPTNO 30 
































3 Null Null 
Null 5 Null 
Null Null 6 


然后 ， 调 用 MAX 函数 把 儿 列 合并 为 一 行 。 


DEPTNO 10 DEPTNO 20 DEPTNO_30 





12.2 ”变换 结果 集成 多 行 


1. 问题 

你 想 把 行 变换 成 列 ， 并 根据 指定 列 的 值 来 决定 每 一 行 原来 的 数据 要 被 划分 到 新 数据 的 哪 一 
列 。 然 而 ， 与 前 一 个 实例 不 同 的 是 ， 你 需要 输出 的 结果 不 止 一 行 。 
例如 ， 你 希望 返回 每 个 员工 和 他 们 的 职位 (对 应 EMP 表 的 JOB 列 ) ， 你 先 查 询 得 到 了 下 面 的 




















ANALYST SCOTT 
ANALYST FORD 
CLERK SMITH 
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CLERK 
CLERK 
CLERK 
MANAGER 
MANAGER 
MANAGER 
PRESIDENT 
SALESMAN 
SALESMAN 
SALESMAN 
SALESMAN 


ADAMS 
MILLER 
JAMES 
JONES 
CLARK 
BLAKE 
KING 
ALLEN 
MARTIN 
TURNER 
WARD 


你 希望 格式 化 上 述 结果 集 ， 为 每 一 种 职位 生成 一 列 新 数据 。 


CLERKS ANALYSTS MGRS PREZ SALES 


MILLER FORD CLARK KING TURNER 

JAMES SCOTT BLAKE MARTIN 

ADAMS JONES WARD 

SMITH ALLEN 
2. 解决 方案 


与 12.1 节 中 的 实例 不 同 ， 本 实例 最 后 输出 的 结果 集会 多 于 一 行 。 因 此 ，12.1 节 中 实例 的 做 
法 不 适用 于 本 例 ， 因 为 如 果 针 对 每 一 个 JOB 列 执行 MAXCENAME) 的 话 ， 会 导致 每 个 JOB 只 对 
应 一 个 ENAME (也 就 是 说 ， 就 会 像 12.1 节 中 的 实例 那样 只 返回 一 行 结果 )。 为 了 解决 这 一 
问题 ， 我 们 必须 保持 每 一 个 JOB/ENAME 组 合 的 唯一 性 。 这 样 一 来 ， 再 调用 聚合 函数 剔除 掉 
Null 的 话 ， 就 不 会 丢失 任何 一 个 ENAME 了 。 

DB2. Oracle 和 SQL Server 
使 用 窗口 函数 ROW. NUMBER. OVER 确保 每 一 个 JOB/ENAME 组 合 都 是 唯一 的 。 针 对 窗口 函数 的 返 
回 值 执行 GROUP BY， 并 使 用 CASE 表达 式 和 聚合 函数 MAX 实现 结果 集 变 换 。 






































job='CLERK' 

ename else null end) as clerks, 
job='ANALYST' 

ename else null end) as analysts, 
jobz'MANAGER' 

ename else null end) as mgrs, 
jobz'PRESIDENT' 

ename else null end) as prez, 
job= 'SALESMAN ' 

ename else null end) as sales 


row_number()over(partition by job order by ename) rn 


1 select max(case when 
2 then 
3 max(case when 
4 then 
5 max(case when 
6 then 
7 max(case when 
8 then 
9 max(case when 
10 then 
11 from ( 
12 select job, 
13 ename, 
14 
15 from emp 
16 )x 
17 group by rn 
PostgreSQL 和 MySQL 


使 用 标量 子 查询 基于 EMPNO 为 每 个 员工 排序 。 针 对 标量 子 查询 的 返回 值 执行 GROUP BY, 并 使 














1 
2 
3 
4 
5 
6 
7 
8 
9 


11 from 
12 select 


16 from 


18 group 


3. 讨论 


select max(case when 


then 


max(case when 


then 


max(case when 


then 


max(case when 


then 


max(case when 


e.job, 
e.ename, 


then 


用 CASE 表达 式 和 聚合 函数 MAX 实现 结果 集 变换 。 


job='CLERK' 

ename else null end) 
job='ANALYST' 

ename else null end) 
job='MANAGER' 

ename else null end) 
job='PRESIDENT' 
ename else null end) 
job='SALESMAN' 

ename else null end) 


(select count(*) from emp d 
where e.job=d.job and e.empno < d.empno) as rnk 


emp e 
) x 
by rnk 


DB2. Oracle 和 SQL Server 
首先 ， 使 用 窗口 函数 ROW NUMBER OVER 确保 每 一 个 JOB/ENAME 组 合 的 唯一 性 。 


select job 
ena 


3 
me, 


as 


as 


as 


as 


as 


clerks, 
analysts, 
mgrs, 
prez, 


sales 


row number()over(partition by job order by ename) rn 


from emp 


ANALYST 
ANALYST 
CLERK 
CLERK 
CLERK 
CLERK 
MANAGER 
MANAGER 
MANAGER 
PRESIDENT 
SALESMAN 
SALESMAN 
SALESMAN 
SALESMAN 


MILLER 
SMITH 
BLAKE 
CLARK 
JONES 
KING 
ALLEN 
MARTIN 
TURNER 
WARD 


+ Q N PP P QN P T QN P N P 




















对 于 一 种 给 定 的 职位 ， 为 其 中 的 每 一 个 ENAME 安排 一 个 唯一 的 “ 行 编号 ”， 这 样 即使 出 现 了 
两 个 员工 具有 相同 名 字 和 职位 的 情况 也 不 会 有 问题 。 这 样 做 是 为 了 既 能 基于 行 编号 (RN) 


分 组 ， 又 不 会 因 











为 使 用 了 MAX 而 遗漏 掉 任何 一 个 员工 。 这 是 解决 本 问题 最 重要 的 一 步 。 如 





果 设 有 这 一 步 ， 外 层 查询 的 聚合 操作 会 剔除 掉 必 要 的 行 。 试 想 一 下 ， 如 果 仍 然 采用 12.1 节 
H ROW_NUMBER OVER 国 数 的 话 ， 会 得 到 怎样 的 结果 集 。 


中 实例 的 做 法 ， 





而 不 使 月 
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RASSE, f — fh JOB 


select max(case 


CL 


SM 


max(case 


max(case 


max(case 


max(case 


from emp 


when 
then 
when 
then 
when 
then 
when 
then 
when 
then 


ERKS ANALYSTS 


ITH SCOTT 


H Z; 





job='CLERK' 
ename else null end) as 
job-' ANALYST ' 
ename else null end) as 
job= ' MANAGER ' 
ename else null end) as 
job-'PRESIDENT' 
ename else null end) as 
job= ' SALESMAN 
ename else null end) as 


MGRS PREZ 


只 会 返 


JONES KING 


S 


clerks, 
analysts, 
mgrs, 
prez, 


sales 


ALES 


回 一 行 : ENAME 值 最 大 的 那个 员工 会 被 返回 。 做 结果 集 变 换 的 





























时 候 ， 使 用 MIN 或 MAX 是 为 了 从 结果 集 里 剔除 掉 Null 值 ， 而 不 是 为 了 过 滤 掉 一 些 ENAME, 





继续 阅读 下 
下 一 步 使 用 CASE 2 


se 


se 


RN 


N PPF QN PF b ÓN P N Pp 











lect rn, 
case 


case 
case 
case 
case 


from ( 
lect job, 





when 
then 
when 
then 
when 
then 
when 
then 
when 
then 


ename, 


row number()over(partition by 


from emp 


)x 


CLERKS 


ADAMS 
JAMES 
MILLER 
SMITH 


job-'CLERK' 

ename else null end as 
job-' ANALYST ' 

ename else null end as 
job= ' MANAGER ' 

ename else null end as 
job= ' PRESIDENT 

ename else null end as 
job= ' SALESMAN ' 

ename else null end as 


ANALYSTS 


MGRS PREZ 
BLAKE 
CLARK 
JONES 
KING 











看 的 讲解 内 容 ， 相 信 你 会 更 加 清楚 地 理解 这 种 状况 是 如 何 产生 的 。 
长 达 式 把 ENAME 分 别 放 入 各 自 的 列 (I0B)。 


clerks, 


analy 
mgrs, 
prez, 


sales 


sts, 


job order by ename) rn 


ALLEN 
MARTIN 





3 TURNER 
4 WARD 


现在 ， 行 已 经 变 成 了 列 ， 最 后 需要 剔除 掉 Null 值 以 提高 结果 集 的 可 读 性 。 为 了 剔除 掉 
NuLL， 需 要 调用 聚合 函数 MAX， 并 基于 RN 执行 GROUP BY。( 这 里 也 可 以 使 用 MIN 函数 。 选 择 
MAX 或 者 MIN 没有 区 别 ， 因 为 每 个 分 组 只 包含 一 个 值 。) 每 个 RN/]JOB/ENAME 组 合 只 包含 一 个 
值 。 基 于 RN 执行 GROUP BY， 并 且 针 对 CASE 表达 式 的 返回 值 调 用 MAX 函数 ， 这 能 够 确保 每 一 
次 调用 MAX 函数 都 会 从 一 个 分 组 中 取出 一 个 ENAME， 而 该 分 组 内 除了 该 ENAME 之 外 ， 其 他 
值 都 是 Null, 


select max(case when job= 'CLERK 

then ename else null end) as clerks, 
max(case when job='ANALYST' 

then ename else null end) as analysts, 
max(case when job='MANAGER' 

then ename else null end) as mgrs, 
max(case when job='PRESIDENT' 

then ename else null end) as prez, 
max(case when job='SALESMAN' 

then ename else null end) as sales 





















































from ( 
select job, 
ename， 
row_number()over(partition by job order by ename) rn 
from emp 
)x 
group by rn 


CLERKS ANALYSTS MGRS PREZ SALES 


MILLER FORD CLARK KING TURNER 
JAMES SCOTT BLAKE MARTIN 
ADAMS JONES WARD 

SMITH ALLEN 


使 用 ROW. NUMBER OVER 生成 唯一 的 组 合 对 于 格式 化 查询 结果 集 非 常 有 用 。 考 虑 如 下 所 示 的 查 
询 ， 它 创建 了 一 个 分 别 以 DEPTNO 和 JOB 为 维度 展示 员工 的 稀 疏 矩阵 报表 。 


select deptno dno, job, 

max(case when deptno=10 

then ename else null end) as d10, 
max(case when deptno=20 

then ename else null end) as d20, 
max(case when deptno=30 

then ename else null end) as d30, 
max(case when job='CLERK' 

then ename else null end) as clerks, 
max(case when job='ANALYST' 

then ename else null end) as anals, 
max(case when job='MANAGER' 

then ename else null end) as mgrs, 
max(case when job='PRESIDENT' 

then ename else null end) as prez, 
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max(case when job='SALESMAN' 
then ename else null end) as sales 
from ( 
select deptno, 
job, 
ename, 


row number()over(partition by job order by ename) rn job, 
row number()over(partition by job order by ename) rn deptno 


from emp 

)x 
group by deptno, job, rn deptno, rn job 
order by 1 


DNO JOB D10 D20 D30 CLERKS ANALS MGRS PREZ SALES 


10 CLERK MILLER MILLER 

10 MANAGER CLARK CLARK 

10 PRESIDENT KING KING 
20 ANALYST FORD FORD 

20 ANALYST SCOTT SCOTT 

20 CLERK ADAMS ADAMS 

20 CLERK SMITH SMITH 

20 MANAGER JONES JONES 

30 CLERK JAMES JAMES 

30 MANAGER BLAKE BLAKE 

30 SALESMAN ALLEN ALLEN 


30 SALESMAN MARTIN MARTIN 
30 SALESMAN TURNER TURNER 


30 SALESMAN WARD WARD 





通过 改变 分 组 列 ( 即 上 述 SELECT 列表 里 的 非 聚合 项 ) ， 可 以 产生 出 不 同 格式 的 报表 。 这 值 




















得 我 们 花 时 间 去 做 一 些 实验 ， 并 深入 理解 GROUP. BY 子 句 包含 的 项 目 发 生 了 改动 之 后 ， 输 出 








结果 的 格式 将 会 发 生 什 么 变化 。 
PostgreSQL 和 MySQL 





对 于 这 两 种 数据 库 而 言 ， 做 法 和 其 他 数据 库 基 本 相同 ， 只 是 创建 唯一 JOB/ENAME 组 合 的 











方法 有 所 不 同 。 首 先 使 用 标量 子 查 询 为 每 一 个 JOB/ENAME 组 合 提 供 


“排名 ”。 
select e.job, 
e.ename, 
(select count(*) from emp d 
where e.job=d.job and e.empno < d.empno) as rnk 
from emp e 
JOB ENAME RNK 


CLERK SMITH 3 
SALESMAN ALLEN 3 
SALESMAN WARD 2 
MANAGER JONES 2 
SALESMAN MARTIN 1 
MANAGER BLAKE 1 


个 “ 行 编号 ”或 





MANAGER CLARK 
ANALYST SCOTT 
PRESIDENT KING 

SALESMAN TURNER 
CLERK ADAMS 
CLERK JAMES 
ANALYST FORD 

CLERK MILLER 


为 每 一 个 JOB/ENAME 组 合 安排 一 个 唯 


@ @ F N @ @ = @ 

















的 “ 行 编号 ”， 这 可 以 确保 每 一 行 都 是 唯 
使 有 两 个 员工 名 字 相 同 ， 其 职位 也 恰好 一 样 ， 他 们 也 不 会 共享 同一 个 “ 行 编号 ”。 





决 本 问题 最 重要 的 一 步 。 如 果 没 有 这 一 步 ， 外 层 查 询 的 聚合 操作 会 剔除 掉 必 要 的 行 。 试 想 
一 下 ， 如 果 仍 然 采 用 12.1 市 中 实例 的 做 法 ， 而 不 为 每 一 个 JOB/ENAME 组 合 安排 一 个 唯一 





“ 行 编号 ”的 话 ， 会 得 到 怎样 的 结果 集 。 


select max(case when job= 'CLERK 
then ename else n 


ull end) as 


max(case when job='ANALYST' 


then ename else n 


ull end) as 


max(case when job='MANAGER' 


then ename else n 


ull end) as 


max(case when job='PRESIDENT' 


then ename else n 


ull end) as 


max(case when job='SALESMAN' 


then ename else n 
from emp 


CLERKS ANALYSTS | MGRS 


ull end) as 


PREZ 

















clerks, 
analysts, 
mgrs, 
prez, 


sales 


SALES 


SMITH SCOTT JONES 





很 不 幸 ， 每 一 种 JB 只 会 返回 一 行 : ENAME 值 最 大 的 那个 员工 会 被 返回 。 做 结果 集 





KING 






































的 。 即 


这 是 解 


的 





变换 的 


时 候 ， 使 用 MIN 或 MAX 是 为 了 从 结果 集 里 剔除 掉 Null 值 ， 而 不 是 为 了 过 滤 掉 一 些 ENAME, 





现在 ， 我 们 已 经 充分 了 解 了 “ 行 编号 ” 
达 式 把 ENAME 分 别 放 入 各 自 的 列 (308) 


select rnk, 

case when job='CLERK' 
then ename else null 

case when job='ANALYST' 
then ename else null 

case when job='MANAGER' 
then ename else null 

case when job='PRESIDENT' 
then ename else null 

case when job='SALESMAN' 
then ename else null 








from ( 
select e.job, 
e.ename, 
(select count(*) from emp 
where e.job=d.job and e. 





的 作用 ， 可 以 接着 做 下 一 步 了 。 下 一 步 使 用 CASE K 


° 


end as cler 
end as anal 
end as mgrs 
end as prez 


end as sale 


d 
empno < d.e 


ks, 
ysts, 
, 


5, 


s 


mpno) as rnk 
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from emp e 


)x 


RNK CLERKS ANALYSTS MGRS PREZ SALES 


3 SMITH 

3 ALLEN 
2 WARD 

2 JONES 

1 MARTIN 
1 BLAKE 

0 CLARK 

1 SCOTT 

0 KING 

0 TURNER 
2 ADAMS 

1 JAMES 

0 FORD 

0 MILLER 


HE, 行 已 经 变 成 了 列 ， 最 后 需要 别 除 掉 Null [8 P| 8 EAR RII n AE, A T XUERTE 
Null, 要 调用 本 全 雪 MAX， 并 且 基 于 RNK 执行 GROUP BY。( 这 里 也 可 以 使 用 MIN 函数 ， 选 择 
MAX 或 者 MIN 没有 区 别 。) 每 个 RNK/30B/ENAME 组 合 只 存在 一 个 值 ， 因 此 调用 了 聚合 函数 之 
Ji, Null 值 会 被 剔除 掉 。 


select max(case when job='CLERK' 

then ename else null end) as clerks, 
max(case when job='ANALYST' 

then ename else null end) as analysts, 
max(case when job='MANAGER ' 

then ename else null end) as mgrs, 
max(case when job='PRESIDENT' 

then ename else null end) as prez, 
max(case when job='SALESMAN' 

then ename else null end) as sales 








from ( 
select e.job, 
e.ename, 
(select count(*) from emp d 
where e.job=d.job and e.empno < d.empno) as rnk 
from emp e 
)x 
group by rnk 


CLERKS ANALYSTS MGRS PREZ SALES 


MILLER FORD CLARK KING TURNER 


JAMES SCOTT BLAKE MARTIN 
ADAMS JONES WARD 
SMITH ALLEN 





12.3 反问 变换 结果 集 


1. 问题 
你 想 把 列 数 据 变换 成 行 数 据 ， 考 虑 如 下 所 示 的 结果 集 。 


DEPTNO 10 DEPTNO_20 DEPTNO_30 




















3 5 6 
你 希望 转换 为 
DEPTNO COUNTS BY DEPT 
10 3 
20 5 
30 6 
2. 解决 方案 


仔细 查看 上 述 的 最 终结 果 集 ， 很 容易 想到 我 们 只 需 针对 EMP 表 执行 COUNT 和 GROUP BY 查询 ， 
就 可 以 得 到 符合 要 求 的 结果 集 。 然 后 ， 对 于 本 实例 而 言 ， 要 先 假 设 原始 数据 集 设 有 被 按照 
行 形式 存储 ， 我 们 可 以 认为 数据 是 存在 于 儿 个 列 中 的 。 

为 了 把 列 数据 变换 成 行 数据 ， 需 要 用 到 笛 卡 儿 积 。 我 们 事先 要 知道 有 多 少 列 需 要 被 转 
换 为 行 形式 ， 因 为 创建 笛 卡 儿 积 时 用 到 的 表 表 达 式 (table expression) 必须 有 一 个 基数 
(cardinality) ， 该 基数 至 少 要 等 于 需要 做 变换 的 列 的 个 数 。 


在 这 里 ， 我 们 不 必 去 创建 一 个 “去 规范 化 表 ”(denormalized table) ， 只 需 重新 使 用 12.1 节 
中 实例 的 代码 生成 一 个 “ 宽 ” 结 果 集 即 可 。 完 整 的 解决 方案 如 下 所 示 。 















































1 select dept.deptno, 
2 case dept.deptno 
3 when 10 then emp cnts.deptno 10 
4 when 20 then emp cnts.deptno 20 
5 when 30 then emp cnts.deptno 30 
6 end as counts by dept 
7 from ( 
8 select sum(case when deptno-10 then 1 else 0 end) as deptno 10, 
9 sum(case when deptno-20 then 1 else 0 end) as deptno 20, 
10 sum(case when deptno-30 then 1 else 0 end) as deptno 30 
11 from emp 
12 ) emp cnts, 
13 (select deptno from dept where deptno «- 30) dept 
3. 讨论 




















UNAM] EMP_CNTS 就 是 上 述 的 非 规范 化 视图 ， 即 “ 宽 ” 结 果 集 ， 也 就 是 变换 前 的 列 形式 的 
数据 ， 如 下 所 示 。 


select sum(case when deptno=10 then 1 else 0 end) as deptno 10, 
sum(case when deptno-20 then 1 else 0 end) as deptno 20, 
sum(case when deptno-30 then 1 else 0 end) as deptno. 30 

from emp 
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DEPTNO 10 DEPTNO_20 DEPTNO_30 





因为 上 述 数 据 分 为 3 列 存储 ， 所 以 我 们 需要 生成 3 行 新 数据 。 首 先 基 于 内 髓 视图 EMP_CNTS 
和 一 个 至 少 有 3 行 数据 的 表 构 造 一 个 笛 卡 儿 积 。 下 面 的 代码 借助 DEPT 表 构 造 了 一 个 笛 卡 儿 





























积 ，DEPT 表 里 有 3 行 数据 。 


select dept.deptno， 
emp cnts.deptno 10, 
emp cnts.deptno 20, 
emp cnts.deptno, 30 
from ( 














select sum(case when deptno-10 then 1 else 0 end) as deptno, 10, 
sum(case when deptno-20 then 1 else 0 end) as deptno 20, 
sum(case when deptno-30 then 1 else 0 end) as deptno, 30 


from emp 
) emp cnts, 
(select deptno from dept where deptno «- 30) dept 


DEPTNO DEPTNO 10 DEPTNO_ 20 JDEPTNO 30 


10 3 5 6 
20 3 5 6 
30 3 5 6 











要 DEPTNO 和 该 DEPTNO 对 应 的 员工 人 数 ， 因 此 要 用 CASE 表达 式 # 


select dept.deptno， 
case dept.deptno 
when 10 then emp_cnts.deptno_10 
when 20 then emp_cnts.deptno_20 
when 30 then emp_cnts.deptno_30 
end as counts_by_dept 
from ( 


第 卡 儿 积 使 得 我 们 能 够 为 内 租 视 图 EMP_CNTS 的 每 一 列 返 回 一 行 数 据 。 由 于 最 终 的 结果 集 需 


每 行 3 列 变 成 每 行 1 列 。 





select sum(case when deptno=10 then 1 else 0 end) as deptno, 10, 
sum(case when deptno=20 then 1 else 0 end) as deptno_20, 
sum(case when deptno=30 then 1 else 0 end) as deptno_30 


from emp 
) emp_cnts, 
(select deptno from dept where deptno <= 30) dept 


DEPTNO COUNTS_BY_DEPT 


12.4 反问 变换 结果 集成 一 列 


1. 问 题 
你 想 把 一 个 查询 结果 合并 成 一 列 。 例 如 ， 你 希 
JOB 和 SAL， 并 且 想 把 3 列 值 合并 成 1 列 。 你 希 








= 
望 








返回 DEPTN0 等 于 10 的 全 体 员 工 的 ENAME、 
为 每 一 个 员工 返回 3 行 数据 ， 员 工 之 间 以 
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空 行 分 隔 开 。 你 希望 得 到 如 下 所 示 的 结果 集 


CLARK 
MANAGER 
2450 


KING 
PRESIDENT 
5000 


MILLER 
CLERK 
1300 


2. 解 决 方案 

关键 在 于 使 用 笛 卡 儿 积 为 每 个 员工 返回 4 行 数据 。 我 们 需要 把 每 一 列 变 成 一 行 ， 并 且 在 两 
个 员工 之 间 多 留 一 个 空白 行 。 

DB2、Oracle 和 SQL Server 


使 用 窗口 函数 ROW_NUMBER OVER 基于 EMPNO 为 每 一 行 数据 排名 (1 ~ 4 行 )。 然 后 ， 使 用 
CASE 表达 式 把 3 列 数据 变 成 1 列 。 








1 select case rn 
2 when 1 then ename 
3 when 2 then job 
4 when 3 then cast(sal as char(4)) 
5 end emps 
6 from ( 
7 select e.ename,e.job,e.sal, 
8 row number(J)over(partition by e.empno 
9 order by e.empno) rn 
10 from emp e, 
11 (select * 
12 from emp where job-'CLERK') four rows 
13 where e.deptno-10 
14 ) x 
PostgreSQL 和 MySQL 














本 实例 着 重 介绍 如 何 使 用 窗口 函数 为 每 一 行 数据 提供 一 个 序号 ， 该 序号 在 之 后 的 结果 集 变 
换 操 作 中 会 被 用 到 。 在 写作 本 书 时 ，PostgreSQL 和 MySQL 尚未 提供 这 样 的 窗口 函数 。 


3. 讨论 
DB2, Oracle 和 SQL Server 
首先 使 用 窗口 函数 ROW. NUMBER OVER 为 DEPTNO 等 于 10 每 一 位 员工 生成 一 个 序号 。 


select e.ename,e.job,e.sal, 
row number()over(partition by e.empno 
order by e.empno) rn 











from emp e 
where e.deptno-10 
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ENAME JOB 
CLARK MANAGER 
KING PRESIDENT 


MILLER CLERK 


SAL RN 
2450 1 
5000 1 
1300 1 


此 时 ， 上 面 的 序号 其 实 并 没有 意义 。 我 们 按照 EMPNO 分 区 ， 因 而 DEPTNO 等 于 10 的 所 有 行 


的 序号 都 是 1。 


现在 我 们 需要 暂停 一 


函数 会 在 FROM 和 WHERE 子 句 之 后 才 被 评估 执行 。 


select e.ename,e.job,e.sal, 
row number()over(par 


from emp e, 
(select * 
from emp where jo 
where e.deptno-10 


ENAME JOB 

CLARK MANAGER 
CLARK MANAGER 
CLARK MANAGER 
CLARK MANAGER 
KING PRESIDENT 
KING PRESIDENT 
KING PRESIDENT 
KING PRESIDENT 


MILLER CLERK 
MILLER CLERK 
MILLER CLERK 
MILLER CLERK 

















如 果 引 入 笛 卡 儿 积 ， 


tition by e.empno 


order by e.empno) rn 


b='CLERK') four_rows 


ui 
© 
© 
© 
+ Q NN E L QQ N FF + Q N Hm 


下 ， 和 仔细 推 戎 两 个 关键 的 要 点 。 
° 每 个 员工 的 RN 值 不 再 是 1， 现 在 它 变 成 了 从 上 到 4 循环 出 现 的 序列 值 ， 原 因 在 于 窗 





一 个 新 员工 时 ，RN 值 会 被 重 置 为 1。 


° RT 

















大 














序号 的 作用 就 显现 出 来 了 ， 如 下 所 示 。 





LI 


此 ， 按 照 EMPNO 分 区 就 导致 当 遇 到 








图 FOUR_ROWS 的 存在 只 是 为 了 返回 一 个 包含 4 行 数据 的 结果 集 。 它 的 作用 仅 限 于 








此 。 我 们 希望 为 每 一 列 (ENAME, JOB 和 SAL) 返回 一 行 ， 然 后 再 加 上 一 个 空 行 。 
剩 下 的 就 是 使 用 CASE 表达 式 把 每 个 员工 的 ENAME, JOB 


现在 ， 最 困难 的 工作 已 经 完成 了 ， 


和 SAL 并 入 一 列 (为 了 保证 CASE 成 功 执行 ， 我 们 还 需要 把 SAL 转换 成 字符 串 ) 。 




















select case rn 
when 1 then ena 
when 2 then job 
when 3 then cas 

end emps 

from ( 

select e.ename,e.job,e.sal, 
row number()over(par 


from emp e, 
(select * 


me 


t(sal as char(4)) 


tition by e.empno 
order by e.empno) rn 














from emp where job='CLERK') four_rows 
where e.deptno=10 


) x 


CLARK 
MANAGER 
2450 


KING 
PRESIDENT 
5000 


MILLER 
CLERK 
1300 


12.5 删除 重复 数据 


1. 问题 

你 正在 生成 一 个 报表 ， 当 相 邻 两 行 的 某 列 出 现 了 相同 值 时 ， 你 希望 那个 值 只 显示 一 次 。 例 
如 ， 你 想 从 EMP 表 中 提取 出 DEPTNO 和 ENAME， 和 希望 按照 DEPTNO 对 所 有 的 行进 行 分 组 ， 并 且 
希望 每 个 DEPTNO 只 显示 一 次 。 你 希望 返回 如 下 所 示 的 结果 集 。 


DEPTNO ENAME 
10 CLARK 
KING 
MILLER 
20 SMITH 
ADAMS 
FORD 
SCOTT 
JONES 
30 ALLEN 
BLAKE 
MARTIN 
JAMES 
TURNER 
WARD 


2. 解决 方案 

这 是 一 个 很 简单 的 格式 化 问题 ，Oracle 提供 的 窗口 函数 LAG OVER 能 很 容易 地 解决 这 一 问题 。 
当然 ， 使 用 标量 子 查询 和 其 他 窗口 函数 也 能 达到 同样 目的 (对 于 非 Oracle 用 户 只 能 如 此 )， 
但 这 里 最 方便 的 做 法 是 使 用 LAG OVER 函数 。 

DB2 和 SQL Server 


使 用 窗口 函数 MIN OVER 为 每 个 DEPTNO 找 出 最 小 的 EMPN0， 然 后 使 用 CASE 表达 式 来 “涂改 ” 
那些 EMPNO 不 等 于 该 最 小 值 的 行 。 
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select case when empno= 
then deptno else null 


end deptno, 
ename 
from ( 


min empno 


min(empno)over(partition by deptno) min empno, 


1 
2 
3 
4 
5 
6 select deptno, 
7 
8 
9 
0 


empno, 
ename 
1 from emp 
11 )x 
Oracle 








使 用 窗口 函数 LAG OVER 访问 当前 行 的 前 一 行 ， 为 每 个 分 区 间 找 出 第 一 个 DEPTNO,, 


select to_number( 


1 

2 decode(lag(deptno)over(order by deptno), 
3 deptno,null,deptno) 
4 
5 


) deptno, ename 
from emp 


PostgreSQL 和 MySQL 


本 实例 着 重 介绍 如 何 使 用 窗口 函数 方便 地 访问 到 当前 行 前 面 和 后 面 的 行 数据 。 在 写作 本 书 


时 ， 这 些 数 据 库 尚未 支持 这 类 窗 
3. 讨论 
DB2 和 SQL Server 








口 函 数 。 


首先 ， 使 用 窗口 函数 MIN OVER 找 出 每 个 DEPTNO 对 应 的 最 小 EMPNO 值 。 


select deptno, 


min(empno)over(partition by deptno) min empno, 


empno, 
ename 
from emp 

DEPTNO MIN EMPNO EMPNO ENAME 
10 7782 7782 CLARK 
10 7782 7839 KING 
10 7782 7934 MILLER 
20 7369 7369 SMITH 
20 7369 7876 ADAMS 
20 7369 7902 FORD 
20 7369 7788 SCOTT 
20 7369 7566 JONES 
30 7499 7499 ALLEN 
30 7499 7698 BLAKE 
30 7499 7654 MARTIN 
30 7499 7900 JAMES 
30 7499 7844 TURNER 
30 7499 7521 WARD 





下 一 步 也 是 最 后 一 步 ， 使 用 CASE 表达 式 删 除 重复 的 DEPTNO。 如 果 一 个 员工 的 EMPNO 和 





MIN EMPNO 相等 ， 则 返回 DEPTNO, H|]; [H| Null, 


select case when empno=min_empno 
then deptno else null 
end deptno, 


ename 
from ( 
select deptno, 


min(empno)over(partition by deptno) min empno, 


empno, 
ename 
from emp 


DEPTNO ENAME 


MILLER 
20 SMITH 
ADAMS 
FORD 
SCOTT 
JONES 
30 ALLEN 
BLAKE 
MARTIN 
JAMES 
TURNER 
WARD 


Oracle 





首先 ， 使 用 窗口 函数 LAG OVER 为 每 一 行 返回 前 一 行 的 DEPTNO, 


select Lag(deptno)over(order by deptno) lag deptno, 


deptno, 
ename 
from emp 


LAG DEPTNO 


DEPTNO 


ENAME 


MILLER 
SMITH 
ADAMS 
FORD 
SCOTT 
JONES 
ALLEN 
BLAKE 
MARTIN 
JAMES 
TURNER 
WARD 
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如 果 仔 细 观 察 以 上 结果 集 的 话 ， 很 容易 区 分 出 哪些 行 的 DEPTN0 和 LAG DEPTNO 相等 。 对 
于 这 些 行 ， 我 们 希望 把 DEPTNO 显示 为 NtL。 我 们 可 以 借助 DECODE 函数 做 到 这 一 点 (T0_ 
NUMBER 函数 可 以 把 DEPTNO 转换 为 数字 )。 


select to_number( 
decode(lag(deptno)over(order by deptno), 
deptno,null,deptno) 
) deptno, ename 
from emp 


DEPTNO ENAME 
10 CLARK 
KING 
MILLER 
SMITH 
ADAMS 
FORD 
SCOTT 
JONES 
ALLEN 
BLAKE 
MARTIN 
JAMES 
TURNER 
WARD 


12.6 ”变换 结果 集 以 实现 跨行 计算 


1. 问题 
你 希望 计算 来 自 多 行 的 数据 。 为 了 让 这 个 任 
这 样 你 需要 的 所 有 值 都 会 出 现在 同一 行 里 。 
在 本 书 的 示例 数据 中 ，DEPTN0 20 是 工资 总 额 最 高 的 部 门 ， 我 们 可 以 通过 下 列 查询 来 确认 一 
下 数据 。 

select deptno, sum(sal) as sal 


from emp 
group by deptno 


2 


© 


3 


© 


次 
š 


变 得 容易 些 ， 你 希望 将 那些 行 都 转换 为 列 ， 





























DEPTNO SAL 
10 8750 
20 10875 
30 9400 


你 希望 计算 出 上 述 DEPTNO 20 和 DEPTNO 10 之 间 的 工资 总 额 的 差 值 ， 以 及 上 述 DEPTNO 20 和 
DEPTNO 30 之 间 的 工资 总 额 差 值 。 

2. 解决 问题 

使 用 聚合 函数 SUM 和 CASE 表达 式 计算 工资 总 额 ， 然 后 在 SELECT 列表 里 做 差 值 计算 。 
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1 select d20_sal - d10_sal as d20_10_diff, 

2 d20 sal - d30_sal as d20 30 diff 

3 from ( 

4 select sum(case when deptno-10 then sal end) as d10 sal, 
5 sum(case when deptno-20 then sal end) as d20 sal, 
6 sum(case when deptno-30 then sal end) as d30 sal 
7 from emp 
8 ) totals by dept 


首先 ， 使 用 CASE 表达 式 把 每 个 DEPTNO 对 应 的 工资 从 行 形式 变换 为 列 形式 。 


select case when deptno=10 then sal end as d10_sal, 
case when deptno=20 then sal end as d20_sal, 
case when deptno=30 then sal end as d30_sal 

from emp 


D10_SAL  D20 SAL D30 SAL 


800 
1600 
1250 
2975 
1250 
2850 
2450 
3000 
5000 
1500 
1100 
950 
3000 
1300 


然后 ， 在 每 一 个 CASE 表达 式 里 调用 聚合 国 数 SUM 计算 出 每 个 DEPTNO 对 应 的 工资 总 额 。 


select sum(case when deptno-10 then sal end) as d10 sal, 
sum(case when deptno-20 then sal end) as d20 sal, 
sum(case when deptno-30 then sal end) as d30 sal 

from emp 


D10 SAL  D20 SAL D30 SAL 


8750 10875 9400 


后 ， 只 要 把 上 述 SQL 查询 放 入 到 内 内 视图 里 ， 并 在 外 层 查询 中 执行 减法 运算 即 可 。 


12.7 创建 国定 大 小 的 数据 桶 
1. 问题 
T de EU e Oe ls 


的 个 数 可 能 是 不 确定 的 ， 但 你 希望 确保 每 个 桶 有 5 个 元 素 。 例 如 ， 你 希望 基于 EMPNO 值 为 
EMP 表 里 的 员工 分 组 ， 一 组 最 多 5 人 ， 结 果 集 显示 如 下 。 
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GRP EMPNO ENAME 
7369 SMITH 
7499 ALLEN 
7521 WARD 
7566 JONES 
7654 MARTIN 
7698 BLAKE 
7782 CLARK 
SCOTT 
7839 KING 
7844 TURNER 
7876 ADAMS 
7900 JAMES 
7902 FORD 
7934 MILLER 


UJ UJ UJ UJ. NJ. N). NJ. NJ. N) iA IS. S S S 
~ 
~ 
OO 
[os 


2. 解决 方案 

对 于 提供 了 排名 函数 的 数据 库 而 言 ， 很 容易 解决 本 问题 。 在 为 每 一 行 数据 生成 了 一 个 序号 
之 后 ， 创 建 含有 5 个 元 素 的 桶 的 问题 就 变 成 了 简单 的 除法 问题 。 做 过 除法 之 后 ， 我 们 只 须 
针对 商 值 向 上 取 整 即 可 。 

DB2、Oracle 和 SQL Server 

使 用 窗口 函数 ROW. NUMBER OVER， 基 于 EMPNO 为 每 个 员工 生成 一 个 序号 。 然 后 用 该 序号 除 以 
5 即 可 实现 分 组 (SQL Server 需要 调用 CEILING 国 数 ， 而 不 是 CEIL 函数 ) 。 





















































1 select ceil(row number()over(order by empno)/5.0) grp, 
2 empno, 
3 ename 
4 from emp 
PostgreSQL 和 MySQL 
使 用 标量 子 查询 为 每 个 EMPNO 生成 一 个 序号 ， 然 后 用 该 序号 除 以 5 以 创建 分 组 。 
1 select ceil(rnk/5.0) as grp, 
2 empno, ename 
3 from ( 
4 select e.empno, e.ename, 
5 (select count(*) from emp d 
6 where e.empno < d.empno)«1 as rnk 
7 from emp e 
8 ) x 
9 order by grp 


3. 讨 论 
DB2、Oracle 和 SQL Server 
按照 EMPNO 排序 后 ， 窗 口 国 数 ROW. NUMBER OVER 为 每 一 行 分 配 了 一 个 排名 或 “ 行 号 ”。 


select row_number()over(order by empno) rn, 
empno, 
ename 
from emp 





7566 JONES 
7654 MARTIN 
7698 BLAKE 
7782 CLARK 
7788 SCOTT 
7839 KING 

TURNER 
7876 ADAMS 
7900 JAMES 
7902 FORD 

7934 MILLER 


将 ROW. NUMBER OVER 函数 的 返回 值 除 以 5 之 后 ， 下 一 步 要 调用 函数 CEIL (sk CEILING), FE 
论 上 ， 除 以 5， 会 把 每 5 行 数据 划 入 一 组 。 也 就 是 说 ,会 有 5 个 值 小 于 或 等 于 1， 同 时 会 
有 5 个 值 大 于 1 但 小 于 或 等 于 2， 剩 下 的 一 组 则 大 于 2 但 小 于 或 等 于 3 (这 一 组 由 最 后 的 4 
行 数据 构成 ， 因 为 EMP 表 一 共 包 含 14 行 数据 ， 并 非 5 的 整数 倍 ) 。 


CEIL 国 数 将 返回 大 于 参数 值 的 最 小 的 整数 。 我 们 需要 这 样 做 ， 因 为 每 一 组 的 编号 都 是 一 个 
整数 值 。 除 法 计算 的 结果 以 及 CEIL 函数 的 返回 值 显示 如 下 。 你 可 以 按照 从 左 到 右 、 从 RN 
到 DIVISION 再 到 GRP 的 顺序 试 着 做 一 下 运算 。 


select row_number()over(order by empno) rn, 
row_number()over(order by empno)/5.0 division, 
ceil(row number()over(order by empno)/5.0) grp, 
empno, 
ename 
from emp 
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RN DIVISION GRP EMPNO ENAME 


1 .2 1 7369 SMITH 
2 .4 1 7499 ALLEN 
3 .6 1 7521 WARD 

4 .8 1 7566 JONES 
5 1 1 7654 MARTIN 
6 1.2 2 7698 BLAKE 
7 1.4 2 7782 CLARK 
8 1.6 2 7788 SCOTT 
9 1.8 2 7839 KING 

10 2 2 7844 TURNER 
11 2.2 3 7876 ADAMS 
12 2.4 3 7900 JAMES 
13 2.6 3 7902 FORD 

14 2.8 3 7934 MILLER 

PostgreSQL 和 MySQL 








首先 借助 标量 子 查询 基于 EMPNO 为 每 一 行 生成 一 个 序号 。 
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select (select count(*) from emp d 
where e.empno < d.empno)+1 as rnk, 
e.empno, e.ename 


from emp e 

order by 1 

RNK EMPNO ENAME 
1 7934 MILLER 
2 7902 FORD 
3 7900 JAMES 
4 7876 ADAMS 
5 7844 TURNER 
6 7839 KING 
7 7788 SCOTT 
8 7782 CLARK 
9 7698 BLAKE 
10 7654 MARTIN 
11 7566 JONES 
12 7521 WARD 
13 7499 ALLEN 
14 7369 SMITH 


ER RNK 值 除 以 $ 之 后 ， 下 一 步 要 调用 函数 CEIL。 理 论 上 ， 除 以 5 会 把 每 5 行 数据 划 入 一 
组 。 也 就 是 说 ， 会 有 5 个 值 小 于 或 等 于 1， 同 时 会 有 5 个 值 大 于 1 但 小 于 或 等 于 2， 剩 下 
的 一 组 则 大 于 2 但 小 于 或 等 于 3 (这 一 组 由 最 后 的 4 行 数 据 构成 ， 因 为 EMP 表 一 共 包 含 14 
行 数据 ， 并 非 5 的 整数 倍 ) 。 除 法 计算 的 结果 以 及 CEIL 函数 的 返回 值 显示 如 下 。 你 可 以 按 
照 从 左 到 右 、 从 RNK 到 DIVISION 再 到 GRP 的 顺序 试 着 做 一 下 运算 。 


select rnk, 
rnk/5.0 as division, 
ceil(rnk/5.0) as grp， 
empno, ename 
from ( 
select e.empno, e.ename, 
(select count(*) from emp d 
where e.empno < d.empno)+1 as rnk 
from emp e 
) x 
order by 1 



































RNK DIVISION GRP EMPNO ENAME 
7934 MILLER 
7902 FORD 
7900 JAMES 
7876 ADAMS 
7844 TURNER 
KING 
7788 SCOTT 
7782 CLARK 
7698 BLAKE 
7654 MARTIN 
7566 JONES 
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12 2.4 3 7521 WARD 

13 2.6 3 7499 ALLEN 

14 2.8 3 7369 SMITH 
12.8 创建 预定 数目 的 桶 
1. 问题 








T 


你 想 把 你 的 数据 分 别 放 入 到 数目 固定 的 桶 上 
入 到 4 个 桶 里 ， 结 果 集 应 该 如 下 所 示 。 


GRP EMPNO ENAME 





面 去。 例如， 你 希望 把 EMP 表 里 的 员工 分 别 放 
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7934 MILLER 


本 实例 和 12.7 节 中 的 实例 恰好 相反 。 在 12.7 节 中 的 实例 里 ， 桶 的 个 数 并 没有 限制 ， 但 每 
个 桶 的 元 素 个 数 却 是 事先 定好 的 。 对 于 本 实例 而 言 ， 你 不 在 乎 每 个 桶 里 有 多 少 个 元 素 ， 但 
需要 创建 固定 数目 (数目 已 知 ) 的 桶 。 


2. 解决 方案 
对 于 那些 提供 了 专 有 函数 帮助 我 们 创建 “ 桶 ”的 数据 库 而 言 ， 很 容易 解决 本 问题 。 但 是 ， 
如 果 数 据 库 不 提供 这 类 函数 ， 则 只 好 为 每 一 行 生 成 一 个 序号 ， 然 后 针对 该 序号 和 执行 模 
运算 以 决定 把 某 一 行 放 入 哪个 桶 ， 此 处 的 代表 我 们 希望 创建 的 桶 的 个 数 。 针 对 部 分 提供 
o 本 解决 方案 将 借助 窗口 函数 NTILE 创建 数目 固定 的 桶 。NTILE 负责 
把 排 好 序 的 集合 分 别 放 入 到 指定 数目 的 桶 里 去 ， 每 一 个 元 素 都 必然 会 被 分 配 到 某 个 桶 中 。 
这 恰好 与 前 面 给 出 的 我 们 所 期 望 的 结果 集 相 一 x TRO Ed) 和 数据， 而 桶 3 和 
桶 4 却 只 有 3 行 。 如 果 数 据 库 不 支持 NTILE， 也 不 必 担 心 。 本 实例 的 主要 目的 是 创建 固定 
数目 的 桶 ， 我 们 没 必要 执着 于 一 定 要 把 某 一 行 放 进 哪 个 桶 。 

DB2 

使 用 窗口 函数 ROW_NUMBER OVER 基于 EMPNO 为 每 一 行 生 成 一 个 序号 ， 然 后 针对 该 序号 和 4 执 
行 模 运 算 以 创建 4 个 桶 。 















































































































































1 select mod(row_number()over(order by empno),4)+1 grp, 
2 empno, 

3 ename 

4 from emp 

5 order by 1 








报表 和 数据 仓库 | 351 





Oracle 和 SQL Server 
DB2 解决 方案 也 适用 于 这 两 种 数据 库 。 除 此 之 外 ， 我 们 还 可 以 使 用 窗口 函数 NTILE 创建 4 




















个 桶 (这 种 做 法 更 简单 )。 
1 select ntile(4)over(order by empno) grp， 
2 empno, 
3 ename 
4 from emp 
MySQL 和 PostgreSQL 
使 用 自 连接 基于 EMPNO 为 每 
1 select mod(count(*),4)+1 as grp， 
2 e.empno, 
3 e.ename 
4 from emp e, emp d 
5 where e.empno >= d.empno 
6 group by e.empno,e.ename 
7 order by 1 
3. 讨论 
DB2 


首先 使 用 窗口 函数 ROW. NUMBER OVER 基于 EMPNO 为 每 一 行 生 成 


行 生成 一 个 序号 ， 然 后 针对 该 序号 和 4 执行 模 运 算 





select row_number()over(order by empno) grp, 


empno, 
ename 
from emp 


GRP EMPNO ENAME 


现在 每 一 行 都 分 配 好 了 序号 ， 下 面 要 调用 模 运 算 函 数 MOD 创建 4 个 桶 。 


select mod(row_number()over(order by empno),4) grp， 


7369 SMITH 
7499 ALLEN 
7521 WARD 

7566 JONES 
7654 MARTIN 
7698 BLAKE 
7782 CLARK 
7788 SCOTT 
KING 

7844 TURNER 
7876 ADAMS 
7900 JAMES 
7902 FORD 

MILLER 
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empno, 
ename 
from emp 


以 创建 桶 。 





MARTIN 
BLAKE 
CLARK 
SCOTT 
KING 
TURNER 
ADAMS 
JAMES 
FORD 
MILLER 
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~ 
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最 后 为 GRP 加 1， 这 样 桶 的 编号 才 会 从 1 而 不 是 0 开始 ， 然 后 还 要 使 用 ORDER BY 基于 GRP 排序 。 





Oracle 和 SQL Server 
NTILE 函数 独 
然后 等 着 看 结果 即 可 。 


MySQL 和 PostgreSQL 














自 完成 了 全 部 工作 。 我 们 只 需要 传递 一 个 参数 告诉 NTILE 我 们 想 要 几 个 桶 ， 


首先 和 EMP 表 生 成 笛 卡 儿 积 ， 这 样 每 一 个 EMPNO 就 能 够 和 其 他 的 任意 EMPN0 进行 比较 了 ， 








下 面 只 截取 了 该 第 卡 儿 积 的 一 部 分 ， 
select e.empno, 
e.ename, 
d.empno, 
d.ename 
from emp e, emp d 









































因为 全 部 的 返回 值 会 有 196 行 (14 RA 14). 












































EMPNO ENAME EMPNO ENAME 

7369 SMITH 7369 SMITH 

7369 SMITH 7499 ALLEN 

7369 SMITH 7521 WARD 

7369 SMITH 7566 JONES 

7369 SMITH 7654 MARTIN 

7369 SMITH 7698 BLAKE 

7369 SMITH 7782 CLARK 

7369 SMITH 7788 SCOTT 

7369 SMITH 7839 KING 

7369 SMITH 7844 TURNER 

7369 SMITH 7876 ADAMS 

7369 SMITH 7900 JAMES 

7369 SMITH 7902 FORD 

7369 SMITH 7934 MILLER 
从 上 述 结果 集中 可 以 看 到 ，SMITH 的 EMPNO 会 和 EMP 表 中 每 一 个 EMPNO 进行 比较 (每 个 员 
THY EMPNO 都 可 以 和 所 有 其 他 员工 的 EMPNO 进行 比较 )。 下 一 步 要 限定 笛 卡 儿 积 的 结果 ， 只 
有 那些 EMPNO 大 于 或 等 于 其 他 EMPNO 的 行 才 会 被 保留 下 来 。 部 分 结果 集 如 下 所 示 (因为 总 
共有 105 47). 

报表 和 数据 仓库 | 353 








select e.empno, 
e.ename, 
d.empno, 
d.ename 
from emp e, emp d 
where e.empno >= d.empno 


EMPNO ENAME EMPNO ENAME 
7934 MILLER 7934 MILLER 
7934 MILLER 7902 FORD 
7934 MILLER 7900 JAMES 
7934 MILLER 7876 ADAMS 
7934 MILLER 7844 TURNER 
7934 MILLER 7839 KING 
7934 MILLER 7788 SCOTT 
7934 MILLER 7782 CLARK 
7934 MILLER 7698 BLAKE 
7934 MILLER 7654 MARTIN 
7934 MILLER 7566 JONES 
7934 MILLER 7521 WARD 
7934 MILLER 7499 ALLEN 
7934 MILLER 7369 SMITH 
7499 ALLEN 7499 ALLEN 
7499 ALLEN 7369 SMITH 
7369 SMITH 7369 SMITH 

















以 上 输出 结果 并 非 全 部 的 结果 集 ， 它 只 包括 来 自 EMP E ¿ËJ MILLER, ALLEN £I SMITH, 
我 只 是 想 告诉 你 WHERE 子 名 会 怎样 限制 笛 卡 儿 积 的 结果 。 因 为 WHERE 子 句 的 EMPNO 过 滤 条 
件 是 “大 于 或 等 于 ”， 这 意味 着 每 个 员工 至 少 有 一 行 查询 结果 ， 因 为 每 个 EMPN0 都 等 于 它 
自身 。 但 是 ， 为 什么 SMITH 只 有 1 行 (在 结果 集 的 左边 )，ALLEN 有 2 行 ， 而 MILLER 
则 有 14 行 呢 ? 原因 就 在 于 WHERE 子 句 里 那个 关于 EMPNO 的 复合 条 件 :“ 大 于 或 等 于 ”。 对 
于 SMITH 而 言 ， 没 有 比 7369 小 的 EMPN0， 因 此 只 有 一 行 数据 返回 。 对 于 ALLEN 而 言 ， 
很 显然 他 的 EMPN0 等 于 其 自身 (因此 返回 了 该 行 数据 )， 但 7499 也 大 于 7369 (SMITH 的 
EMPNO), ， 因 此 会 返回 两 行 数据 。 对 于 MILLER 而 言 ， 他 的 EMPNO 7934 大 于 EMP 表 中 所 有 其 
他 EMPNO (并 且 显 然 也 等 于 其 自身 )， 因 此 会 返回 14 行 数据 。 


现在 我 们 可 以 比较 每 一 个 EMPNO， 并 且 决 定 哪些 大 于 其 他 的 值 。 在 自 连 接 查 询 里 使 用 聚合 
ER. COUNT 返回 一 个 更 具 表现 力 的 结果 集 。 


select count(*) as grp， 
e.empno， 
e.ename 
from emp e, emp d 
where e.empno >= d.empno 
group by e.empno,e.ename 






















































































order by 1 

GRP EMPNO ENAME 
1 7369 SMITH 
2 7499 ALLEN 
3 7521 WARD 
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现在 每 一 行 都 有 了 一 个 序号 ， 先 对 GRP 和 4 执行 模 运 算 ， 然 后 再 加 上 1， 这 样 就 创建 


7566 
7654 
7698 
7782 
7788 
7839 
7844 
7876 
7900 
7902 
7934 


JONES 
MARTIN 
BLAKE 
CLARK 
SCOTT 
KING 
TURNER 
ADAMS 
JAMES 
FORD 
MILLER 











上 上 
一 


4 个 桶 (加 1 是 为 了 让 桶 从 1 开始 ， 而 不 是 0)。 针 对 GRP 使 用 ORDER BY 子 句 进行 排序 ， 这 


样 就 能 以 合适 的 顺序 输出 最 终结 果 。 


select 


from 
where 
group 
order 























mod(count(*),4)+1 as grp, 


e.empno, 


e.ename 


emp e, emp d 


e.empno 


>= d.empno 


by e.empno,e.ename 


by 1 


ENAME 
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12.9 
1. 问题 


你 想 


数 ， 用 一 个 “*” 代 表 一 个 员工 。 你 希望 返回 


DEPTNO 


JAMES 
JONES 
SCOTT 
SMITH 
FORD 
MARTIN 
KING 
ALLEN 
BLAKE 
MILLER 
TURNER 
WARD 
CLARK 
ADAMS 


创建 水 平 直方 图 





想 用 SQL 创建 水 平 直方 图 。 例 如 ， 你 希望 以 水 平 直方 图 

















的 形式 显示 每 个 部 门 的 员工 人 











*****x 


WA x x 


如 下 所 示 的 结果 集 。 
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2. 解决 方案 

解决 本 问题 的 关键 是 使 用 聚合 函数 COUNT 和 GROUP BY DEPTNO 计算 每 个 DEPTNO 对 应 的 员工 人 
数 。 然 后 ， 把 COUNT 的 返回 值 传递 给 字符 串 函 数 以 生成 一 系列 的 “* ”字符 。 

DB2 

使 用 REPEAT 国 数 生成 直方 图 。 





1 select deptno, 

2 repeat('*',count(*)) cnt 
3 from emp 

4 group by deptno 


Oracle, PostgreSQL 和 MySQL 

使 用 LPAD 函数 生成 所 需 的 字符 串 “*”。 
1 select deptno, 
2 lpad('*',count(*),'*') as cnt 
3 from emp 
4 group by deptno 

SQL Server 

使 用 REPLICATE 函数 生成 直方 图 。 





1 select deptno, 

2 replicate('*',count(*)) cnt 
3 from emp 

4 group by deptno 


3. 讨论 
对 于 所 有 的 数据 库 而 言 ， 这 里 用 到 的 方法 很 类 似 。 唯 一 的 不 同 之 处 在 于 用 来 生成 代表 员工 
人 数 的 * 字符 串 的 函数 。 下 面 的 讨论 以 Oracle 解决 方案 为 例 ， 但 也 包含 了 其 他 的 解决 方案 。 
首先 计算 出 每 个 部 门 的 员工 人 数 。 
select deptno, 
count(*) 


from emp 
group by deptno 


























DEPTNO COUNT(*) 


10 3 
20 5 
30 6 








然后 ， 用 COUNT(*) 的 返回 值 控制 每 个 部 门 对 应 的 * 字 符 的 个 数 。 只 要 把 COUNT(*) 作为 参 
数 传递 给 LPAD 函数 就 可 以 生成 所 需 数 目的 *。 
select deptno, 
lpad('*',count(*),'*') as cnt 
from emp 
group by deptno 
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DEPTNO CNT 


20 ****x* 


30 kx x «x 


PostgreSQL 用 户 需要 明确 地 把 COUNT(*) 的 返回 值 先 转换 成 整数 ， 如 下 所 示 。 


select deptno, 
lpad('*',count(*)::integer,'*') as cnt 
from emp 
group by deptno 





DEPTNO CNT 


20 ***k**x 
30 炎炎 光大 火炎 


上 面 的 CAST 函数 调用 是 必须 的 ， 因 为 PostgreSQL 要 求 LPAD 的 参数 为 整数 。 


12.10 创建 垂直 直方 图 


1. 问题 
你 想 生 成 一 个 从 下 向 上 增长 的 直方 图 。 例 如 ， 你 希望 以 垂直 直方 图 的 方式 显示 每 个 部 门 的 
员工 人 数 ， 每 个 * 代表 一 个 员工 。 你 希望 返回 如 下 所 示 的 结果 集 。 












































D10 D20 D30 

* 
* * 
* * 
* * 
* * 
* * 

2. 解决 方案 


我 们 将 以 12.2 节 中 的 方法 为 基础 解决 本 问题 

DB2、Oracle 和 SQL Server 

使 用 窗口 函数 ROW. NUMBER OVER 为 每 个 DEPTNO 的 每 一 个 * 生成 唯一 的 序号 。 使 用 聚合 函数 
MAX 变换 结果 集 ， 并 针对 ROW NUMBER OVER 国 数 的 返回 值 执行 GROUP BY, SQL Server 用 户 不 
要 在 该 ORDER BY 子 句 中 使 用 DESC。 








1 select max(deptno_10) d10, 

2 max(deptno_20) d20, 

3 max(deptno_30) d30 

4 from ( 

5 select row_number()over(partition by deptno order by empno) rn, 
6 case when deptno=10 then '*' else null end deptno_10, 

7 case when deptno=20 then '*' else null end deptno_20, 

8 case when deptno=30 then '*' else null end deptno_30 

9 from emp 
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10 )x 
11 group by rn 
12 order by 1 desc, 2 desc, 3 desc 


PostgreSQL 和 MySQL 
使 用 标量 子 查询 为 每 个 DEPTNO 的 每 一 个 * 生 成 唯一 的 序号 。 针 对 内 骨 视 








EE 














X 的 返回 


值 调 


用 聚合 国 数 MAX， 同 时 也 针对 RNK 执行 GROUP BY 以 实现 结果 集 变 换 。MySQL 用 户 不 要 在 


ORDER BY 子 句 中 使 用 DESC, 


select max(deptno 10) as d10, 
max(deptno 20) as d20, 
max(deptno 30) as d30 

from ( 

select case when e.deptno-10 then '*' else null end deptno 10, 
case when e.deptno-20 then '*' else null end deptno 20, 
case when e.deptno-30 then '*' else null end deptno 30, 
(select count(*) from emp d 

where e.deptno-d.deptno and e.empno < d.empno ) as rnk 

10 from emp e 

11 )x 

12 group by rnk 

13 order by 1 desc, 2 desc, 3 desc 


3. 讨论 
DB2, Oracle fe SQL Server 


\D OO +I ON n + Q N P 





首先 使 用 窗口 函数 ROW. NUMBER 为 每 个 DEPTN0 的 每 一 个 * 生成 唯一 的 序号 。 使 用 CASE 表达 














式 为 每 个 部 门 的 每 个 员工 返回 一 个 *。 


select row number()over(partition by deptno order by empno) rn, 
case when deptno-10 then '*' else null end deptno 10, 
case when deptno-20 then '*' else null end deptno 20, 
case when deptno-30 then '*' else null end deptno 30 
from emp 


RN DEPTNO 10 DEPTNO 20 JDEPTNO 30 


* * * 
E 3 3 R X 


ON n + QO N BF n + Q N PF Q N P 


* * * * * * 


下 一 步 也 是 最 后 一 步 ， 针 对 每 个 CASE 表达 式 调用 聚合 函数 MAX， 并 基于 RN 分 组 剔除 掉 


Null fÉ, DA ASC 或 DESC 方式 排序 取决 于 数据 库 如 何 对 Null 值 排序 。 
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select max(deptno_10) d10, 
max(deptno_20) d20, 
max(deptno_30) d30 
from ( 
select row number()over(partition by deptno order by empno) rn, 
case when deptno-10 then '*' else null end deptno. 10, 
case when deptno-20 then '*' else null end deptno 20, 
case when deptno-30 then '*' else null end deptno. 30 
from emp 
)x 
group by rn 
order by 1 desc, 2 desc, 3 desc 


D10 D20 D30 


* * * * ob 


PostgreSQL 和 MySQL 
首先 ， 使 用 标量 子 查 询 为 每 个 DEPTO 的 每 一 个 * 生成 唯一 的 序号 。 该 标量 子 查询 基于 
EMPNO 为 每 个 DEPTNO 的 员工 生成 序号 ， 因 此 不 可 能 有 重复 项 。 使 用 CASE 表达 式 为 每 个 部 门 
的 每 一 个 员工 返回 一 个 *。 
select case when e.deptno=10 then '*' else null end deptno 10, 
case when e.deptno-20 then '*' else null end deptno 20, 
case when e.deptno-30 then '*' else null end deptno. 30, 


(select count(*) from emp d 
where e.deptno-d.deptno and e.empno « d.empno ) as rnk 














from emp e 
DEPTNO 10 DEPTNO 20 DEPTNO 30 RNK 
* 4 
5 
4 
* 3 
3 
2 
p 2 
* 2 
* 1 
* 1 
< 1 
* 0 
* 0 
* 0 


然后 ， 针 对 每 个 CASE 表达 式 调 用 聚合 国 数 MAX。 这 样 一 来 ， 按 照 RNK 分 组 后 就 能 够 从 结果 
集中 剔除 掉 Null 值 了 。 以 ASC 或 DESC 方式 排序 取决 于 数据 库 如 何 对 Null 值 排序 。 
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select max(deptno_10) as d10, 
max(deptno_20) as d20, 
max(deptno_30) as d30 
from ( 
select case when e.deptno=10 then '*' else null end deptno 10, 
case when e.deptno-20 then '*' else null end deptno 20, 
case when e.deptno-30 then '*' else null end deptno 30, 
(select count(*) from emp d 
where e.deptno-d.deptno and e.empno « d.empno ) as rnk 
from emp e 


group by rnk 
order by 1 desc, 2 desc, 3 desc 


D10 D20 D30 
* 
* * 
* * 
* * * 
* * * 
* * * 


12.11 返回 非 分 组 列 


1. 问题 

你 正在 执行 GROUP Bv 查询 ， 并 希望 通过 SELECT 列表 返回 一 些 列 ， 但 这 些 列 却 不 会 出 现在 
GROUP BY 子 句 里 。 这 通常 无 法 办 到 ， 因 为 不 能 保证 这 些 列 在 每 个 分 组 里 都 有 唯一 的 值 。 
假设 你 希望 找 出 每 个 部 门 工 资 最 高 和 最 低 的 员工 ， 同 时 也 希望 找 出 每 个 职位 对 应 的 工资 最 
高 和 最 低 的 员工 。 你 想 查 看 每 个 员工 的 名 字 、 部 门 、 职 位 以 及 工资 。 你 希望 返回 如 下 所 示 
的 结果 集 。 


























DEPTNO ENAME JOB SAL DEPT STATUS JOB STATUS 
10 MILLER CLERK 1300 LOW SAL IN DEPT TOP SAL IN JOB 
10 CLARK MANAGER 2450 LOW SAL IN JOB 


10 KING A PRESIDENT 5000 TOP SAL IN DEPT TOP SAL IN JOB 
20 SCOTT ANALYST 3000 TOP SAL IN DEPT TOP SAL IN JOB 
20 FORD ANALYST 3000 TOP SAL IN DEPT TOP SAL IN JOB 


20 SMITH CLERK 800 LOW SAL IN DEPT LOW SAL IN JOB 
20 JONES MANAGER 2975 TOP SAL IN JOB 
30 JAMES CLERK 950 LOW SAL IN DEPT 

30 SALESMAN 1250 LOW SAL IN JOB 
30 WARD SALESMAN 1250 LOW SAL IN JOB 
30 ALLEN SALESMAN 1600 TOP SAL IN JOB 


30 BLAKE MANAGER 2850 TOP SAL IN DEPT 
不 幸 的 是 ， 如 果 把 上 述 所 有 列 都 放 入 SELECT 子 句 的话， 将 会 破坏 分 组 操作 。 考 虑 如 下 的 例 
子 。 员 工 KING 的 工资 最 高 ， 你 想 用 下 列 查询 验证 这 一 点 。 


select ename,max(sal) 
from emp 
group by ename 








以 上 查询 将 返回 EMP 表 的 全 部 
是 因为 那个 分 组 操作 的 存在 : 








语句 看 起 来 好 像 能 够 “ 找 出 工资 最 高 的 员工 ”， 但 实际 的 执行 结果 却 是 “ 找 出 了 EMP 表 里 





每 个 ENAME 对 应 的 最 高 工资 ”。 
JC A. GROUP BY 子 句 的 方法 。 


2. 解决 方案 





14 行 数据 ， 而 不 只 是 KING 及 其 工资 。 之 所 以 会 这 样 ， 正 
它 会 针对 每 个 ENAME 调用 MAX(SAL) 函数 。 因 此 ， 上 述 SQL 








因此 ， 本 实例 将 介绍 一 种 能 够 查询 到 ENAME 却 不 必 把 ENAME 





使 用 内 咀 视 图 找 出 每 个 DEPTNO 和 JOB 对 应 的 最 高 和 最 低 的 工资 。 然 后 ， 筛 选 出 工资 等 于 这 





些 值 的 员工 。 
DB2、Oracle 和 SQL Server 











使 用 窗口 函数 MAX OVER 和 MIN OVER 找 出 每 个 DEPTNO 和 JOB 对 应 的 最 高 和 最 低 的 工资 。 然 


后 ， 筛 选 出 工资 与 之 匹配 的 行 。 


1 select deptno,ename, job,sal, 
2 case when sal - max by dept 
3 then 'TOP SAL IN DEPT' 
4 when sal = min by dept 
5 then 'LOW SAL IN DEPT' 
6 end dept status, 
7 case when sal - max by job 
8 then 'TOP SAL IN JOB' 
9 when sal = min by job 
10 then 'LOW SAL IN JOB' 
11 end job status 
12 from ( 
13 select deptno,ename, job,sal, 
14 max(sal)over(partition by deptno) max by dept, 
15 max(sal)over(partition by job) max by job, 
16 min(sal)over(partition by deptno) min by dept, 
17 min(sal)over(partition by job) min by job 
18 from emp 
19 ) emp. sals 
20 where sal in (max by dept,max by. job, 
21 min by dept,min by job) 
PostgreSQL 和 MySQL 


使 用 标量 子 查 询 找 出 每 个 DEPTNO 和 JOB 对 应 的 最 高 和 最 低 的 工资 。 然 后 ， 只 保留 与 之 匹配 


的 员工 。 


select deptno,ename, job,sal, 
case when sal - max by dept 
then 'TOP SAL IN DEPT' 
when sal - min by dept 


end as dept status, 
case when sal - max by job 


1 
2 
3 
4 
5 then 'LOW SAL IN DEPT' 
6 
7 
8 


then 'TOP SAL IN JOB' 


9 when sal = min by job 
10 then 'LOW SAL IN JOB' 
11 end as job status 
12 from ( 
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13 
14 
15 
16 
17 
18 
19 
20 
21 
22 
23 
24 
25 


3. 讨论 
DB2. Oracle 和 SQL Server 
首先 使 用 窗口 函数 MAX OVER 和 MIN OVER 找 出 每 个 DEPTNO 和 J0B 对 应 的 最 高 和 最 低 的 工资 。 


select deptno,ename,job,sal, 


DE 


select e.deptno,e.ename,e.job,e.sal, 
select max(sal) from emp d 


( 
( 
( 
( 


from e 


) 


where d.de 


select max(sal) from emp d 


ptno = e.deptno) as max_by_dept, 


where d.job = e.job) as max_by_job, 


select min(sal) from emp d 


where d.de 


select min(sal) from emp d 
where d.job = e.job) as min_by_job 


mp e 
x 


ptno = e.deptno) as min_by_dept, 


where sal in (max_by_dept,max_by_job, 
min_by_dept,min_by_job) 


max(sal)over(partition 


max(sal)over(partition by job) 


min(sal)over(partition 


min(sal)over(partition by job) 


from emp 
PTNO ENAME 


10 MILLE 
10 CLARK 
10 KING 

20 SCOTT 
20 FORD 

20 SMITH 
20 JONES 
20 ADAMS 
30 JAMES 
30 MARTI 
30 TURNE 
30 WARD 

30 ALLEN 
30 BLAKE 


JOB 


R CLERK 
MANAGER 
PRESIDENT 
ANALYST 
ANALYST 
CLERK 
MANAGER 
CLERK 
CLERK 

N SALESMAN 

R SALESMAN 
SALESMAN 
SALESMAN 
MANAGER 


by deptno) maxDEPT, 


maxJOB, 


by deptno) minDEPT, 
minJOB 


SAL MAXDEPT MAXJOB MINDEPT MINJOB 


1300 5000 
2450 5000 
5000 5000 
3000 3000 
3000 3000 
800 3000 
2975 3000 
1100 3000 
950 2850 
1250 2850 
1500 2850 
1250 2850 
1600 2850 
2850 2850 


1300 800 
1300 2450 
1300 5000 
800 3000 
800 3000 
800 800 
800 2450 
800 800 
950 800 
950 1250 
950 1250 
950 1250 
950 1250 
950 2450 


现在 ， 每 个 人 的 工资 都 可 以 和 当前 DEPTNO 和 JOB 对 应 的 最 高 和 最 低 的 工资 进行 比较 了 。 需 
的 是 ， 上 述 窗口 函数 背后 的 分 组 操作 (上述 SELECT 子 句 里 的 那 4 列 ) 并 不 会 影响 


要 注 
MIN OVER 和 MAX OVE 


ACHKA — 1 HG 


E: 
E 
A 








R 函数 的 返回 

















值 。 这 充分 展现 了 窗口 函数 的 优雅 之 处 聚合 运算 是 基于 
指定 的 “分 组 ”或 分 区 展开 的 ， 并 且 会 为 每 个 分 组 返 
图 ， 并 且 只 保留 那些 与 窗口 





回 多 行 数据 。 最 后 只 要 把 上 述 窗口 函 


国 数 返回 值 相 匹配 的 行 即 可 。 在 最 终 的 














结果 集中 ， 我 们 将 使 用 CASE 表达 式 显示 每 个 员工 的 “状态 ”。 


select deptno,ename,job,sal, 
case when sal = 
then 'TOP SAL IN DEPT' 


when sal = 


max_by_dept 


min by dept 





from 
select 


from 


where 


DEPTNO 


then 'LOW SAL IN DEPT' 


end dept_status, 


case when sal = max_by_job 
then 'TOP SAL IN JOB' 
when sal = min_by_job 
then 'LOW SAL IN JOB' 


end job_status 


( 


deptno,ename,job, 


sal, 


nax(sal)over(partition 
nax(sal)over(partition 
min(sal)over(partition 
min(sal)over(partition 


emp 


)x 


sal in (max by, dept,max by job, 
min by. dept,min by. job) 


MILLER CLERK 
CLARK MANAGER 
KING PRESIDENT 
SCOTT ANALYST 
FORD ANALYST 
SMITH CLERK 
JONES MANAGER 
JAMES CLERK 
MARTIN SALESMAN 
WARD SALESMAN 
ALLEN SALESMAN 
BLAKE MANAGER 


PostgreSQL fe MySQL 


首先 使 用 标量 子 查 询 找 昌 





1300 
2450 
5000 
3000 
3000 

800 
2975 

950 
1250 
1250 
1600 
2850 


by deptno) max_by_dept, 
by job) max_by_job, 
by deptno) min by dept, 
by job) min by. job 


DEPT STATUS 


LOW SAL IN 


TOP 
TOP 
TOP 
LOW 


LOW 


TOP 


SAL 
SAL 
SAL 
SAL 


SAL 


SAL 


select e.deptno,e.ename,e.job,e.sal, 
(select max(sal) from emp d 
= e.deptno) as maxDEPT, 
(select max(sal) from emp d 

where d.job = e.job) as maxJOB, 
(select min(sal) from emp d 
= e.deptno) as minDEPT, 
(select min(sal) from emp d 

where d.job - e.job) as minJOB 


from 


DEPTNO 


where d.deptno 


where d.deptno 


emp e 


SMITH CLERK 

ALLEN SALESMAN 
WARD SALESMAN 
JONES MANAGER 
MARTIN SALESMAN 
BLAKE | MANAGER 


IN 
IN 
IN 
IN 


IN 


IN 


DEPT 


JOB, STATUS 


SAL MAXDEPT MAXJOB MINDEPT MINJOB 


每 个 DEPTNO 和 JOB 对 应 的 最 高 和 最 低 的 工资 。 
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10 
20 
10 
30 
20 
30 
20 
10 


CLARK MANAGER 2450 5000 
SCOTT ANALYST 3000 3000 
KING X PRESIDENT 5000 5000 
TURNER SALESMAN 1500 2850 
ADAMS CLERK 1100 3000 
JAMES CLERK 950 2850 
FORD ANALYST 3000 3000 
MILLER CLERK 1300 5000 


2975 
3000 
5000 
1600 
1300 
1300 
3000 
1300 


1300 2450 
800 3000 
1300 5000 
950 1250 
800 800 
950 800 
800 3000 
1300 800 














现在 ， 每 个 DEPTNO 和 JOB 对 应 的 最 高 和 最 低 的 工资 可 以 和 EMP 表 里 其 他 的 工资 比较 了 。 最 


后 ， 把 上 述 标量 子 查 询 放 和 人 到 一 个 内 艇 视图 里 ， 并 














只 保留 那些 工资 与 之 相 匹配 的 员工 即 


可 。 在 最 终 的 结果 集中 ， 我 们 将 使 用 CASE 表达 式 显示 每 个 员工 的 “状态 ”。 


select 


from 
select 


from 


where 


DEPTNO 


deptno,ename,job,sal, 
case when sal = max_by_dept 
then 'TOP SAL IN DEPT' 
when sal = min_by_dept 
then 'LOW SAL IN DEPT' 
end as dept_status, 
case when sal = max_by_job 
then 'TOP SAL IN JOB' 
when sal = min by job 
then 'LOW SAL IN JOB' 
end as job status 
( 
e.deptno,e.ename,e. job,e.sal, 
(select max(sal) from emp d 
where d.deptno 
(select max(sal) from emp d 
where 
(select 
where 
(select 
where 
emp e 
)x 
sal in (max by, dept,max, by job, 
min by dept,min by. job) 


min(sal) from emp d 
d.deptno 
min(sal) from emp d 


d.job = e.job) as max by job, 


d.job = e.job) as min by job 


e.deptno) as max by dept, 


e.deptno) as min by dept, 


JOB STATUS 


ENAME JOB SAL DEPT STATUS 
CLARK MANAGER 2450 

KING PRESIDENT 5000 TOP SAL IN DEPT 
MILLER CLERK 1300 LOW SAL IN DEPT 
SMITH CLERK 800 LOW SAL IN DEPT 
FORD ANALYST 3000 TOP SAL IN DEPT 
SCOTT ANALYST 3000 TOP SAL IN DEPT 
JONES MANAGER 2975 

ALLEN SALESMAN 1600 

BLAKE MANAGER 2850 TOP SAL IN DEPT 
MARTIN SALESMAN 1250 

JAMES CLERK 950 LOW SAL IN DEPT 
WARD SALESMAN 1250 
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12.12 ”计算 简单 的 小 计 


1 .问题 

在 本 实例 中 ,“ 简 单 的 小 计 ” 指 的 是 一 种 特殊 的 结果 集 ， 该 结果 集 不 仅 包 括 某 一 列 的 聚合 
运算 结果 ， 也 包括 了 整个 表 中 该 列 的 合计 值 。 例 如 ， 一 个 结果 集 里 既 包括 了 EMP 表 各 个 
JOB 对 应 的 工资 合计 值 ， 也 包括 了 全 部 工资 的 总 计 。EMP RKA JOB 对 应 的 工资 合计 值 是 小 
计 ， 全 部 工资 的 合计 值 是 总 计 。 上 述 结果 集 看 起 来 应 该 如 下 所 示 。 





























JOB SAL 
ANALYST 6000 
CLERK 4150 
MANAGER 8275 
PRESIDENT 5000 
SALESMAN 5600 
TOTAL 29025 
2. 解决 方案 





针对 GROUP BY 子 句 的 ROLLUP 扩展 完美 地 解决 了 本 问题 。 对 于 不 支持 ROLLUP 的 数据 库 ， 可 
以 借助 标量 子 查询 或 UNION 查询 解决 本 问题 ， 当 然 做 法 会 繁琐 一 些 。 

DB2 和 Oracle 

使 用 聚合 函数 SUM 计算 工资 合计 值 ， 并 使 用 GROUP BY 的 ROLLUP 扩展 构造 出 同时 包含 小 计 
(Ez 308 分 区 ) 和 总 计 (针对 全 表 数 据 ) 的 结果 集 。 





























1 select case grouping(job) 
2 when 0 then job 
3 else 'TOTAL' 
4 end job, 
5 sum(sal) sal 

6 from emp 

7 group by rollup(job) 


SQL Server fe MySQL 

使 用 聚合 函数 SUM 计算 工资 合计 值 ， 并 使 用 WITH ROLLUP 构造 出 同时 包含 小 计 ( 按 J08 分 
区 ) 和 总 计 (针对 全 表 数 据 ) 的 结果 集 。 然 后 调用 COALESCE 函数 把 总 计 行 的 标题 改 为 
TOTAL (否则 这 一 行 的 JOB 列 会 出 现 Nutt fü), 









































1 select coalesce(job,'TOTAL') job, 
2 sum(sal) sal 

3 from emp 

4 group by job with rollup 


如 果 是 SQL Server， 也 可 以 不 使 用 COALESCE 函数 ， 我 们 可 以 像 上 述 Oracle 和 DB2 的 解决 
方案 那样 使 用 GROUPING 国 数 来 判断 聚合 运算 的 层级 。 

PostgreSQL 

使 用 聚合 函数 SUM 计算 各 个 DEPTNO 的 工资 合计 值 ， 然 后 使 用 UNION ALL 把 该 查询 和 生成 全 
表 的 工资 总 计 的 查询 连 在 一 起 。 
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1 select job, sum(sal) as sal 
2 from emp 

3 group by job 

4 union all 

5 select 'TOTAL', sum(sal) 

6 from emp 


3. 讨论 
DB2 和 Oracle 


首先 使 用 聚合 函数 SUM, FXE JOB 分 组 并 生成 各 个 208 的 工资 合计 值 。 





select job, sum(sal) sal 
from emp 
group by job 


ANALYST 6000 
CLERK 4150 
MANAGER 8275 
PRESIDENT 5000 
SALESMAN 5600 

















然后 ， 使 用 GROUP BY BJ ROLLUP 扩展 在 各 个 JOB 的 工资 小 计 之 外 ， 


select job, sum(sal) sal 
from emp 
group by rollup(job) 


JOB SAL 
ANALYST 6000 
CLERK 4150 
MANAGER 8275 
PRESIDENT 5000 
SALESMAN 5600 

29025 
































最 后 ， 借 助 GROUPING 函数 把 工资 总 计 行 对 应 的 208 列 的 显示 内 容 修改 一 下 。 
Null, JBZ GROUPING 函数 会 返回 1, 这 意味 着 SAL 值 是 由 ROLLUP 生成 的 工资 总 计 。 如 果 








再 生成 一 个 工资 总 计 。 


如 果 JOB 值 是 
































JOB 值 不 为 NuLL， 则 GROUPING 函数 将 返回 606， 这 意味 着 SAL 值 是 GROUP BY 查询 的 结果 ， 而 








不 是 ROLLUP 的 结果 。 在 CASE 表达 式 中 调用 GROUPING(J0B) ; 
职位 或 代表 总 计 行 的 标签 TOTAL。 


select case grouping(job) 
when 0 then job 
else 'TOTAL' 
end job, 
sum(sal) sal 
from emp 
group by rollup(job) 


这 样 就 能 根据 需要 返回 





具体 的 





ANALYST 6000 
CLERK 4150 
MANAGER 8275 
PRESIDENT 5000 
SALESMAN 5600 
TOTAL 29025 
SQL Server 和 MySQL 


首先 使 用 聚合 函数 SuM， 按 照 JOB 分 组 生成 各 个 JOB 的 工资 合计 值 。 


select job, sum(sal) sal 
from emp 
group by job 


ANALYST 6000 
CLERK 4150 
MANAGER 8275 
PRESIDENT 5000 
SALESMAN 5600 


然后 ， 使 用 GROUP BY 的 ROLLUP 扩展 在 各 个 JoB 的 工资 小 计 之 外 ， 再 生成 一 个 工资 总 计 。 


select job, sum(sal) sal 
from emp 
group by job with rollup 





JOB SAL 
ANALYST 6000 
CLERK 4150 
MANAGER 8275 


PRESIDENT 5000 
SALESMAN 5600 
29025 


最 后 ， 针 对 JoB 列 调用 COEALESCE 函数 。 如 果 JOB [fj 7j Null, SAL 值 就 是 由 ROLLUP 生成 
的 工资 总 计 。 如 果 JOB 值 不 为 NtL， 则 SAL 值 是 由 通常 的 GROUP BY 产生 的 结果 ， 而 不 是 
ROLLUP 的 结果 。 
select coalesce(job,'TOTAL') job, 
sum(sal) sal 


from emp 
group by job with rollup 

















JOB SAL 
ANALYST 6000 
CLERK 4150 
MANAGER 8275 
PRESIDENT 5000 
SALESMAN 5600 
TOTAL 29025 








报表 和 数据 仓库 | 367 





PostgreSQL 


首先 对 结果 按照 

















select job, sum(sal) sal 


from 
group 


emp 
by job 


ANALYST 6000 


CLERK 


4150 


MANAGER 8275 
PRESIDENT 5000 
SALESMAN 5600 


最 后 ， 在 上 述 查询 的 基础 上 使 用 UNION ALL 查询 生成 的 工资 总 计 。 


JOB 分 组 ， 并 使 用 聚合 





job, sum(sal) as sal 


'TOTAL', sum(sal) 


select 
from emp 
group by job 
union all 
select 
from emp 
JOB SAL 
ANALYST 6000 
CLERK 4150 
MANAGER 8275 
PRESIDENT 5000 
SALESMAN 5600 
TOTAL 29025 


12.13 


1. 问题 
你 想 按 照 DEPTNO. JOB e JOB/DEPTNO 组 合 分 别 计算 出 工资 合计 值 。 同 时 ， 你 也 
EMP 表 的 工资 总 计 。 你 希 


函数 SUM 生成 各 个 208 的 工资 合计 值 。 


计算 所 有 可 能 的 表达 


望 得 到 如 下 所 示 的 结果 集 





大 式 组 合 的 小 计 





=< 


布 


望 得 到 





DEPTNO JOB CATEGORY SAL 
10 CLERK TOTAL BY DEPT AND JOB 1300 

10 MANAGER TOTAL BY DEPT AND JOB 2450 

10 PRESIDENT TOTAL BY DEPT AND JOB 5000 

20 CLERK TOTAL BY DEPT AND JOB 1900 

30 CLERK TOTAL BY DEPT AND JOB 950 

30 SALESMAN TOTAL BY DEPT AND JOB 5600 

30 MANAGER TOTAL BY DEPT AND JOB 2850 

20 MANAGER TOTAL BY DEPT AND JOB 2975 

20 ANALYST TOTAL BY DEPT AND JOB 6000 
CLERK TOTAL BY JOB 4150 
ANALYST TOTAL BY JOB 6000 
MANAGER TOTAL BY JOB 8275 
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PRESIDENT TOTAL BY JOB 5000 
SALESMAN TOTAL BY JOB 5600 
10 TOTAL BY DEPT 8750 
30 TOTAL BY DEPT 9400 
20 TOTAL BY DEPT 10875 
GRAND TOTAL FOR TABLE 29025 
2. 解决 方案 


近年 来 ， 对 于 GROUP BY 语法 的 扩展 使 得 本 问题 的 解决 变 得 容易 多 了 。 对 于 那些 尚 不 支持 这 


一 类 扩展 语法 的 数据 库 ， 就 必须 (通过 








自 连 接 或 多 个 标量 子 查询 ) 手动 计算 出 多 种 层次 的 








小 计 。 
DB2 
对 于 DB2， 需 要 把 GROUPING 函数 的 返回 值 转换 为 CHAR(1) 类 型 。 
1 select deptno, 
2 job, 
3 case cast(grouping(deptno) as char(1))|| 
4 cast(grouping(job) as char(1)) 
5 when '00' then 'TOTAL BY DEPT AND JOB' 
6 when '10' then 'TOTAL BY JOB' 
7 when '01' then 'TOTAL BY DEPT' 
8 when '11' then 'TOTAL FOR TABLE' 
9 end category, 
10 sum(sal) 
11 from emp 
12 group by cube(deptno,job) 
13 order by grouping(job),grouping(deptno) 
Oracle 


使 用 GROUP BY 子 名 的 CUBE 扩展 以 及 字符 串 连接 操作 符 | |。 























1 select deptno， 

2 job, 

3 case grouping(deptno)||grouping(job) 

4 when '00' then 'TOTAL BY DEPT AND JOB' 

5 when '10' then 'TOTAL BY JOB' 

6 when '01' then 'TOTAL BY DEPT' 

T when '11' then 'GRAND TOTAL FOR TABLE' 

8 end category, 

9 sum(sal) sal 

10 from emp 

11 group by cube(deptno, job) 

12 order by grouping(job),grouping(deptno) 
SQL Server 
使 用 GROUP. BY 子 句 的 CUBE 扩展 。 对 于 SQL Server， 需 要 把 GROUPING 函数 的 返回 值 转换 成 
CHAR(1) 类 型 ， 并 且 要 使 用 字符 串 连接 操作 符 + (不 同 于 Oracle 的 || 操作 符 )。 

1 select deptno， 

2 job, 

3 case cast(grouping(deptno)as char(1))+ 

4 cast(grouping(job)as char(1)) 
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5 when '00' then 'TOTAL BY DEPT AND JOB' 
6 when '10' then 'TOTAL BY JOB' 

7 when '01' then 'TOTAL BY DEPT' 

8 when '11' then 'GRAND TOTAL FOR TABLE' 
9 end category, 

10 sum(sal) sal 


11 from emp 
12 group by deptno,job with cube 
13 order by grouping(job),grouping(deptno) 


PostgreSQL 和 MySQL 
使 用 多 个 UNION ALL， 把 每 种 类 型 的 合计 合并 到 一 起 。 


1 select deptno, job, 

2 'TOTAL BY DEPT AND JOB' as category, 

3 sum(sal) as sal 

4 from emp 

5 group by deptno, job 

6 union all 

7 select null, job, 'TOTAL BY JOB', sum(sal) 

8 from emp 

9 group by job 

10 union all 

11 select deptno, null, 'TOTAL BY DEPT', sum(sal) 
12 from emp 

13 group by deptno 

14 union all 

15 select null,null,'GRAND TOTAL FOR TABLE', sum(sal) 
16 from emp 


3. 讨论 
Oracle, DB2 和 SQL Server 
这 3 种 数据 库 的 解决 方案 大 体 相 同 。 首 先 使 用 聚合 国 数 SUM， 按 照 DEPTNO 和 JOB 分 组 ， 找 
出 每 个 JOB 和 DEPTNO 组 合 对 应 的 工资 合计 值 。 
select deptno, job, sum(sal) sal 


from emp 
group by deptno, job 





DEPTNO JOB SAL 
10 CLERK 1300 
10 MANAGER 2450 
10 PRESIDENT 5000 
20 CLERK 1900 
20 ANALYST 6000 
20 MANAGER 2975 
30 CLERK 950 
30 MANAGER 2850 
30 SALESMAN 5600 


下 一 步 是 生成 3OB 和 DEPTNO 的 工资 小 计 ， 以 及 全 表 的 工资 总 计 。 使 用 GROUP BY 子 句 的 
CUBE 扩展 ， 分 别 按照 DEPTNO. JOB 和 全 表 的 维度 执行 SAL 列 的 聚合 运算 。 





select 


from 
group 


DEPTNO 


10 
10 
10 
10 
20 
20 
20 
20 
30 
30 
30 
30 


deptno, 

job, 

sum(sal) sal 

emp 

by cube(deptno,job) 


JOB SAL 

29025 
CLERK 4150 
ANALYST 6000 
MANAGER 8275 


SALESMAN 5600 
PRESIDENT 5000 


8750 
CLERK 1300 
MANAGER 2450 
PRESIDENT 5000 

10875 
CLERK 1900 
ANALYST 6000 
MANAGER 2975 

9400 
CLERK 950 
MANAGER 2850 


SALESMAN 5600 





然后 ， 使 用 GROUPING 函数 和 CASE 表达 式 把 上 述 结果 格式 化 为 更 有 意义 的 输出 。GROUPING(I0B) 





的 返回 值 应 该 是 1 或 0， 这 取决 于 SAL 值 是 否 来 自 CUBE。 如 果 结 果 来 自 CUBE， 则 返回 











值 为 


0， 否 则 返回 1, GROUPING(DEPTNO) 的 返回 值 也 是 如 此 。 再 回头 看 一 下 本 解决 方案 的 第 一 
步 ， 我 们 知道 它 是 按照 DEPTNO 和 JOB 进行 分 组 的 。 因 此 ， 如 果 SAL 值 是 基于 DEPTNO 和 JOB 
组 合计 算 而 来 的 ， 那 么 GROUPING 函数 调用 的 返回 值 将 是 0。 执 行 结果 显示 如 下 。 


select 


from 
group 
order 


DEPTNO 























deptno， 

job， 

grouping(deptno) is_deptno_subtotal, 
grouping(job) is, job subtotal, 
sum(sal) sal 

emp 

by cube(deptno, job) 

by 3,4 


CLERK 
MANAGER 
PRESIDENT 
CLERK 
CLERK 
SALESMAN 
MANAGER 
MANAGER 
ANALYST 


Ccococoocococococooco 
B= @ e e@ @ @ @ @ @ O 
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20 

30 
CLERK 
ANALYST 
MANAGER 
PRESIDE 
SALESMA 





最 后 ， 使 用 CASE 表达 式 确 认 每 一 行 的 归属 





的 返回 值 来 决定 的 。 


select deptno, 
job， 











NT 
N 


Bp p p = e° 





Hl 


case grouping(deptno)||grouping(job) 


when '00' then 


wh 


en 


when '01' then 'TOTAL BY DEPT' 


wh 
end cat 
sum(sal 

from emp 


en 
egory, 
) sal 


'11' then 


group by cube(deptno, job) 
order by grouping(job),grouping(deptno) 


DEPTNO JOB 


10 CLERK 
10 MANAGER 
10 PRESIDE 
20 CLERK 
30 CLERK 


CATEGORY SAL 
TOTAL BY DEPT AND JOB 1300 
TOTAL BY DEPT AND JOB 2450 
NT TOTAL BY DEPT AND JOB 5000 
TOTAL BY DEPT AND JOB 1900 
TOTAL BY DEPT AND JOB 950 
N TOTAL BY DEPT AND JOB 5600 


30 SALESMA 

30 MANAGER 

20 MANAGER 

20 ANALYST 
CLERK 
ANALYST 
MANAGER 
PRESIDE 
SALESMA 

10 

30 

20 


-E38 Oracle 解决 方案 在 做 字符 有 


TOTAL 
TOTAL 
TOTAL 
TOTAL 
TOTAL 
TOTAL 
NT TOTAL 
N TOTAL 
TOTAL 
TOTAL 
TOTAL 
GRAND 


BY DEPT AND JOB 2975 
BY DEPT AND JOB 6000 
BY JOB 4150 
BY JOB 6000 
BY JOB 8275 
BY JOB 5000 
BY JOB 5600 
BY DEPT 8750 
BY DEPT 9400 
BY DEPT 10875 
TOTAL FOR TABLE 29025 








1 10875 
1 9400 
0 4150 
0 6000 
0 8275 
0 5000 
0 5600 
1 29025 


这 是 基于 GROUPING(JOB) 和 GROUPING(DEPTNO) 


'TOTAL BY DEPT AND JOB' 
'10' then 'TOTAL BY JOB' 


'GRAND TOTAL FOR TABLE ' 


连接 操作 时 ， 把 两 个 GROUPING 函数 的 返回 值 隐 式 地 转换 


成 了 字符 类 型 。 对 于 DB2 和 SQL Server 而 言 ， 则 需要 显 式 地 把 GROUPING 函数 的 返回 值 转 


换 成 CHAR(1) 数据 类 型 ， 正 如 上 述 解 决 方案 所 示 。 男 外 ， 把 两 个 GROUPING 函数 调用 的 返回 





值 拼 接 成 一 个 字符 


例如 ， 我 们 可 以 用 GROUPING SETS 模仿 CUBE 的 输出 结 





BF, SQL Server 用 户 必须 使 用 + 操作 符 ， 而 不 是 | | 操作 符 。 
对 于 Oracle 和 DB2 而 言 ，GROUP BY 还 有 一 个 GROUPING SETS 语法 扩展 ， 该 扩展 也 非常 有 用 。 























果 ， 如 下 所 示 。( 和 CUBE 解决 方案 一 





FÉ, DB2 和 SQL Server 需要 对 GROUPING 函数 的 返回 值 进行 显 式 的 数据 类 型 转换 。) 





select deptno， 
job， 
case grouping(deptno)||grouping(job) 


when '00' then 'TOTAL BY DEPT AND JOB' 


when '10' then 'TOTAL BY JOB' 
when '01' then 'TOTAL BY DEPT' 


when '11' then 'GRAND TOTAL FOR TABLE' 


end category, 
sum(sal) sal 
from emp 


group by grouping sets ((deptno),(job), (deptno, job), ()) 


DEPTNO JOB CATEGORY SAL 
10 CLERK TOTAL BY DEPT AND JOB 1300 
20 CLERK TOTAL BY DEPT AND JOB 1900 
30 CLERK TOTAL BY DEPT AND JOB 950 
20 ANALYST TOTAL BY DEPT AND JOB 6000 
10 MANAGER TOTAL BY DEPT AND JOB 2450 
20 MANAGER TOTAL BY DEPT AND JOB 2975 
30 MANAGER TOTAL BY DEPT AND JOB 2850 
30 SALESMAN TOTAL BY DEPT AND JOB 5600 
10 PRESIDENT TOTAL BY DEPT AND JOB 5000 


CLERK TOTAL BY JOB 4150 
ANALYST TOTAL BY JOB 6000 
MANAGER TOTAL BY JOB 8275 
SALESMAN TOTAL BY JOB 5600 
PRESIDENT TOTAL BY JOB 5000 
10 TOTAL BY DEPT 8750 
20 TOTAL BY DEPT 10875 
30 TOTAL BY DEPT 9400 


GRAND TOTAL FOR TABLE 29025 


GROUPING SETS 的 奇妙 之 处 在 于 它 允 许 我 们 定义 分 组 。 上 述 查 询 中 的 GROUPING SETS 子 句 分 
别 指定 了 按照 DEPTNO 分 组 ， 按 照 JOB 分 组 ， 按 照 DEPTNO 和 JOB 的 组 合 分 组 ， 以 及 最 后 空 
白 括号 代表 的 总 计 。GROUPING SETS 能 够 非常 灵活 地 支持 不 同 维 度 的 聚合 运算 。 例 如 ， 如 果 


我 们 希望 改 一 下 上 面 的 例子 ， 去 掉 GRAND TOTAL, JÉ Z 
号 删除 掉 就 可 以 了 。 
/* 去 掉 总 计 */ 





select deptno, 
job, 
case grouping(deptno)||grouping(job) 





只 要 把 GROUPING SETS 子 句 的 空白 括 


when '00' then 'TOTAL BY DEPT AND JOB' 


when '10' then 'TOTAL BY JOB' 
when '01' then 'TOTAL BY DEPT' 


when '11' then 'GRAND TOTAL FOR TABLE' 


end category, 
sum(sal) sal 
from emp 


group by grouping sets ((deptno),(job),(deptno, job)) 
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DEPTNO JOB CATEGORY SAL 


10 CLERK TOTAL BY DEPT AND JOB 1300 
20 CLERK TOTAL BY DEPT AND JOB 1900 
30 CLERK TOTAL BY DEPT AND JOB 950 
20 ANALYST TOTAL BY DEPT AND JOB 6000 
10 MANAGER TOTAL BY DEPT AND JOB 2450 
20 MANAGER TOTAL BY DEPT AND JOB 2975 
30 MANAGER TOTAL BY DEPT AND JOB 2850 
30 SALESMAN TOTAL BY DEPT AND JOB 5600 
10 PRESIDENT TOTAL BY DEPT AND JOB 5000 

CLERK TOTAL BY JOB 4150 

ANALYST TOTAL BY JOB 6000 

MANAGER TOTAL BY JOB 8275 

SALESMAN TOTAL BY JOB 5600 

PRESIDENT TOTAL BY JOB 5000 
10 TOTAL BY DEPT 8750 
20 TOTAL BY DEPT 10875 
30 TOTAL BY DEPT 9400 


我 们 也 可 以 删除 一 个 小 计 ， 例 如 基于 DEPTO 的 小 计 ， 只 要 从 GROUPING SETS 子 句 中 去 掉 
“(DEPTNO)” 就 可 以 了 。 


/* 去 掉 DEPTNO 小 计 */ 


select deptno, 
job, 
case grouping(deptno)||grouping(job) 
when '00' then 'TOTAL BY DEPT AND JOB' 
when '10' then 'TOTAL BY JOB' 
when '01' then 'TOTAL BY DEPT' 
when '11' then 'GRAND TOTAL FOR TABLE' 
end category, 
sum(sal) sal 


from emp 
group by grouping sets ((job),(deptno,job),()) 
order by 3 
DEPTNO JOB CATEGORY SAL 
GRAND TOTAL FOR TABLE 29025 
10 CLERK TOTAL BY DEPT AND JOB 1300 
20 CLERK TOTAL BY DEPT AND JOB 1900 
30 CLERK TOTAL BY DEPT AND JOB 950 
20 ANALYST TOTAL BY DEPT AND JOB 6000 
20 MANAGER TOTAL BY DEPT AND JOB 2975 
30 MANAGER TOTAL BY DEPT AND JOB 2850 
30 SALESMAN TOTAL BY DEPT AND JOB 5600 
10 PRESIDENT TOTAL BY DEPT AND JOB 5000 
10 MANAGER TOTAL BY DEPT AND JOB 2450 
CLERK TOTAL BY JOB 4150 
SALESMAN TOTAL BY JOB 5600 
PRESIDENT TOTAL BY JOB 5000 
MANAGER TOTAL BY JOB 8275 
ANALYST TOTAL BY JOB 6000 


如 上 所 述 ，GROUPING SETS 确实 能 更 方便 地 帮助 我 们 从 不 同 角度 获得 总 计 和 小 计 。 





PostgreSQL 和 MySQL 
首先 使 用 聚合 函数 SUM， 并 按照 DEPTNO 和 JOB 进行 分 组 。 


select deptno, job, 
'TOTAL BY DEPT AND JOB' as category, 
sum(sal) as sal 
from emp 
group by deptno, job 





DEPTNO JOB CATEGORY SAL 
10 CLERK TOTAL BY DEPT AND JOB 1300 
10 MANAGER TOTAL BY DEPT AND JOB 2450 
10 PRESIDENT TOTAL BY DEPT AND JOB 5000 
20 CLERK TOTAL BY DEPT AND JOB 1900 
20 ANALYST TOTAL BY DEPT AND JOB 6000 
20 MANAGER TOTAL BY DEPT AND JOB 2975 
30 CLERK TOTAL BY DEPT AND JOB 950 
30 MANAGER TOTAL BY DEPT AND JOB 2850 
30 SALESMAN TOTAL BY DEPT AND JOB 5600 


然后 ， 使 用 UNION ALL 把 基于 JOB 分 组 的 工资 合计 值 合并 进来 。 


select deptno, job, 
'TOTAL BY DEPT AND JOB' as category, 
sum(sal) as sal 
from emp 
group by deptno, job 
union all 
select null, job, 'TOTAL BY JOB', sum(sal) 
from emp 
group by job 

















DEPTNO JOB CATEGORY SAL 
10 CLERK TOTAL BY DEPT AND JOB 1300 
10 MANAGER TOTAL BY DEPT AND JOB 2450 
10 PRESIDENT TOTAL BY DEPT AND JOB 5000 
20 CLERK TOTAL BY DEPT AND JOB 1900 
20 ANALYST TOTAL BY DEPT AND JOB 6000 
20 MANAGER TOTAL BY DEPT AND JOB 2975 
30 CLERK TOTAL BY DEPT AND JOB 950 
30 MANAGER TOTAL BY DEPT AND JOB 2850 
30 SALESMAN TOTAL BY DEPT AND JOB 5600 


ANALYST TOTAL BY JOB 6000 
CLERK TOTAL BY JOB 4150 
MANAGER TOTAL BY JOB 8275 
PRESIDENT TOTAL BY JOB 5000 
SALESMAN TOTAL BY JOB 5600 





了 使 用 UNION ALL 把 基于 DEPTNO 分 组 的 工资 合计 值 合并 进来 。 


select deptno, job, 
'TOTAL BY DEPT AND JOB' as category, 
sum(sal) as sal 


farri 
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from emp 

group by deptno, job 

union all 

select null, job, 'TOTAL BY JOB', sum(sal) 
from emp 

group by job 

union all 

select deptno, null, 'TOTAL BY DEPT', sum(sal) 
from emp 

group by deptno 


DEPTNO JOB CATEGORY SAL 
10 CLERK TOTAL BY DEPT AND JOB 1300 
10 MANAGER TOTAL BY DEPT AND JOB 2450 
10 PRESIDENT TOTAL BY DEPT AND JOB 5000 
20 CLERK TOTAL BY DEPT AND JOB 1900 
20 ANALYST TOTAL BY DEPT AND JOB 6000 
20 MANAGER TOTAL BY DEPT AND JOB 2975 
30 CLERK TOTAL BY DEPT AND JOB 950 
30 MANAGER TOTAL BY DEPT AND JOB 2850 
30 SALESMAN TOTAL BY DEPT AND JOB 5600 


ANALYST TOTAL BY JOB 6000 
CLERK TOTAL BY JOB 4150 
MANAGER TOTAL BY JOB 8275 
PRESIDENT TOTAL BY JOB 5000 
SALESMAN TOTAL BY JOB 5600 
10 TOTAL BY DEPT 8750 
20 TOTAL BY DEPT 10875 
30 TOTAL BY DEPT 9400 


最 后 ， 使 用 UNION ALL 把 EMP 表 的 工资 总 计 合 并 进来 。 


select deptno, job, 
'TOTAL BY DEPT AND JOB' as category, 
sum(sal) as sal 
from emp 
group by deptno, job 
union all 
select null, job, 'TOTAL BY JOB', sum(sal) 
from emp 
group by job 
union all 
select deptno, null, 'TOTAL BY DEPT', sum(sal) 
from emp 
group by deptno 
union all 
select null,null, 'GRAND TOTAL FOR TABLE', sum(sal) 
from emp 





DEPTNO JOB CATEGORY SAL 
10 CLERK TOTAL BY DEPT AND JOB 1300 
10 MANAGER TOTAL BY DEPT AND JOB 2450 
10 PRESIDENT TOTAL BY DEPT AND JOB 5000 
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20 
20 
20 
30 
30 
30 


10 
20 
30 


12.14 
1. 问题 


CLERK 
ANALYST 
MANAGER 
CLERK 
MANAGER 
SALESMAN 
ANALYST 
CLERK 
MANAGER 
PRESIDENT 
SALESMAN 


识别 非 小 计 行 


TOTAL 
TOTAL 
TOTAL 
TOTAL 
TOTAL 
TOTAL 
TOTAL 
TOTAL 
TOTAL 
TOTAL 
TOTAL 
TOTAL 
TOTAL 
TOTAL 
GRAND 


BY 
BY 
BY 
BY 
BY 
BY 
BY 
BY 
BY 
BY 
BY 
BY 
BY 
BY 


DEPT 
DEPT 
DEPT 
DEPT 
DEPT 
DEPT 
JOB 
JOB 
JOB 
JOB 
JOB 
DEPT 
DEPT 
DEPT 


AND 
AND 
AND 
AND 
AND 
AND 


JOB 
JOB 
JOB 
JOB 
JOB 
JOB 


TOTAL FOR TABLE 


1900 
6000 
2975 
950 
2850 
5600 
6000 
4150 
8275 
5000 
5600 
8750 
10875 
9400 
29025 


你 已 经 知道 如 何 使 用 GROUP BY 子 句 的 CUBE 扩展 语法 生成 报表 ， 并 且 你 需要 知道 如 何 区 分 
哪些 行 是 由 普通 的 GROUP BY 子 句 产生 的 ， 


下 面 给 出 了 一 组 利用 GROUP BY 的 CUBE 扩展 语法 生成 的 查询 结果 集 ， 它 是 EMP 表 中 员工 工资 
的 一 个 分 类 汇总 结果 。 














DEPTNO 


JOB 


10 
10 
10 
10 
20 
20 
20 
20 
30 
30 
30 
30 





CLERK 
ANALYST 
MANAGER 
SALESMAN 
PRESIDENT 


CLERK 
MANAGER 
PRESIDENT 


CLERK 
ANALYST 
MANAGER 


CLERK 
MANAGER 
SALESMAN 


哪些 和 





J 是 由 CUBE 或 ROLLUP 产生 的 。 





以 上 报表 展示 了 按照 DEPTNO 和 208 分 组 计算 出 来 的 (每 个 DEPTNO 对 应 的 每 一 种 JOB 的 ) 
工资 合计 值 ， m E rt O 
的 总 计 (EM 表 的 工资 合计 值 ) 。 
度 ， 并 标记 出 每 一 个 


值 ， 以 及 最 后 





按照 DEPTNO 分 组 计算 的 结果 ， 


聚合 运 





























你 希 \ 布 








运算 结果 分 别 属于 哪 x 


pidas iot ct 

















VIN A EROR 
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如 下 所 示 的 结果 集 。 


DEPTNO JOB SAL DEPTNO_SUBTOTALS JOB_SUBTOTALS 
29025 1 1 
CLERK 4150 1 0 
ANALYST 6000 1 0 
MANAGER 8275 1 0 
SALESMAN 5600 1 0 
PRESIDENT 5000 1 0 
10 8750 0 1 
10 CLERK 1300 0 0 
10 MANAGER 2450 0 0 
10 PRESIDENT 5000 0 0 
20 10875 0 1 
20 CLERK 1900 0 0 
20 ANALYST 6000 0 0 
20 MANAGER 2975 0 0 
30 9400 0 1 
30 CLERK 950 0 0 
30 MANAGER 2850 0 0 
30 SALESMAN 5600 0 0 
2. 解决 方案 


使 用 GROUPING 函数 判断 哪些 值 是 CUBE 或 ROLLUP 的 小 计 结 果 ， 即 超级 聚合 (supera ggregate) 
值 。 下 面 是 DB2 和 Oracle 的 示例 代码 。 














1 select deptno, job, sum(sal) sal, 

2 grouping(deptno) deptno_subtotals, 
3 grouping(job) job_subtotals 

4 from emp 

5 group by cube(deptno,job) 





相 较 于 DB2 和 Oracle 解决 方案 ，SQL Server 解决 方案 唯一 的 不 同 之 处 在 于 CUBE/ROLLUP F- 
名 的 语法 。 

1 select deptno, job, sum(sal) sal, 

2 grouping(deptno) deptno_subtotals, 

3 grouping(job) job_subtotals 

4 from emp 

5 group by deptno,job with cube 


本 实例 的 重点 在 于 展示 如 何 使 用 CUBE 和 GROUPING 处 理 小 计 计算 。 在 写作 本 书 时 ，PostgreSQL 
和 MySQL 尚 不 支持 CUBE 或 GROUPING, 

3. 讨论 

如 果 DEPTNO SUBTOTALS 等 于 0， 并 且 JOB_SUBTOTALS 等 于 1 (此 时 JoB 是 Null), J| Z, SAL 
值 就 是 CUBE 查询 生成 的 、 按 照 pEPTNO 分 组 的 小 计 结果 。 如 果 JOB_SUBTOTALS 等 于 0， 并 且 
DEPTNO SUBTOTALS 等 于 1 (此 时 DEPTNO 是 Null), JZ, SAL 值 就 是 CUBE 查询 生成 的 、 按 照 
JOB 分 组 的 小 计 结 果 。 如 果 JOB_SUBTOTALS 和 DEPTNO_ SUBTOTALS 都 等 于 1， 那么 SAL 值 就 是 
CUBE 查询 生成 的 工资 总 计 。DEPTNO_SUBTOTALS 和 JOB_SUBTOTALS 都 等 于 0 的 行 则 是 通常 的 
聚合 运算 结果 (每 个 DEPTN0/30B 组 合 对 应 的 SAL 合计 )。 















































E 
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12.15 ”使 用 CASE 表 达 式 标记 行 数据 

1. 问题 
你 想 把 某 列 的 值 映射 成 一 系列 的 “布尔 ”标志 位 。 例 如 ， 对 于 EM 表 的 JOB 列 ， 你 希望 得 
到 如 下 所 示 的 结果 集 。 


ENAME IS_CLERK IS SALES IS MGR IS ANALYST IS PREZ 




















KING 0 0 0 0 1 
SCOTT 0 0 0 1 0 
FORD 0 0 0 1 0 
JONES 0 0 1 0 0 
BLAKE 0 0 1 0 0 
CLARK 0 0 1 0 0 
ALLEN 0 1 0 0 0 
WARD 0 1 0 0 0 
MARTIN 0 1 0 0 0 
TURNER 0 1 0 0 0 
SMITH 1 0 0 0 0 
MILLER 1 0 0 0 0 
ADAMS 1 0 0 0 0 
JAMES 1 0 0 0 0 











类 似 上 述 这 样 的 结果 集 在 调试 程序 的 时 候 往往 很 有 用 ， 并 且 它 也 提供 了 一 种 不 同 于 普通 结 
果 集 的 数据 视图 。 
2. 解决 方案 

使 用 CASE 表达 式 评 估 每 个 员工 的 JOB 值 ， 并 返回 1 或 0 以 标记 评估 结果 。 我 们 需要 写 一 组 
CASE 表达 式 为 每 一 种 可 能 的 JOB 值 创建 一 列 返 回 值 。 
































1 select ename, 

2 case when job = 'CLERK' 

3 then 1 else 0 

4 end as is_clerk, 

5 case when job = 'SALESMAN' 
6 then 1 else 0 

7 end as is_sales, 

8 case when job = 'MANAGER' 


9 then 1 else 0 

10 end as is_mgr, 

11 case when job = 'ANALYST' 
12 then 1 else 0 

13 end as is analyst, 

14 case when job = 'PRESIDENT' 
15 then 1 else 0 

16 end as is prez 


17 from emp 

18 order by 2,3,4,5,6 
3. 讨论 
本 解决 方案 的 代码 非常 易于 理解 。 如 果 你 还 是 不 太 理 解 的 话 ， 不 妨 把 JB 列 也 放 入 到 
SELECT 子 句 里 。 
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select ename, 

job, 

case when job = 'CLERK' 
then 1 else 0 

end as is clerk, 

case when job = 'SALESMAN' 
then 1 else 0 

end as is, sales, 

case when job - 'MANAGER' 
then 1 else 0 

end as is, mgr, 

case when job - 'ANALYST' 
then 1 else 0 

end as is analyst, 

case when job - 'PRESIDENT' 
then 1 else 0 

end as is prez 


from emp 
order by 2 
ENAME JOB IS CLERK IS SALES IS MGR IS ANALYST IS PREZ 
SCOTT ANALYST 0 0 0 1 0 
FORD ANALYST 0 0 0 1 0 
SMITH CLERK l 0 0 0 0 
ADAMS CLERK 1 0 0 0 0 
MILLER CLERK ii 0 0 0 0 
JAMES CLERK 1 0 0 0 0 
JONES MANAGER 0 0 1 0 0 
CLARK MANAGER 0 0 1 0 0 
BLAKE MANAGER 0 0 1 0 0 
KING PRESIDENT 0 0 0 0 1 
ALLEN SALESMAN 0 1 0 0 0 
MARTIN SALESMAN 0 1 0 0 0 
TURNER SALESMAN 0 1 0 0 0 
WARD SALESMAN 0 1 0 0 0 
2s 
12.16 创建 稀疏 矩阵 
1. 问题 
你 想 创建 一 个 稀 玻 和 矩阵， 把 EMP BJ DEPTNO 和 JOB 列 变换 成 如 下 所 示 的 结果 集 。 
D10 D20 D30 CLERKS MGRS PREZ ANALS SALES 
SMITH SMITH 
ALLEN ALLEN 
WARD WARD 
JONES JONES 
MARTIN MARTIN 
BLAKE BLAKE 
CLARK CLARK 
SCOTT SCOTT 
KING KING 
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TURNER TURNER 
ADAMS ADAMS 
JAMES JAMES 
FORD FORD 
MILLER MILLER 


2. 解决 方案 

使 用 一 组 CASE 表达 式 创 建 一 个 稀有 矩阵， 实现 从 行 到 列 的 变换 。 
1 select case deptno when 10 then ename end as d10, 

2 case deptno when 20 then ename end as d20, 

3 case deptno when 30 then ename end as d30, 

4 case job when 'CLERK' then ename end as clerks, 

5 case job when 'MANAGER' then ename end as mgrs, 

6 case job when 'PRESIDENT' then ename end as prez, 

7 case job when 'ANALYST' then ename end as anals, 

8 

9 


case job when 'SALESMAN' then ename end as sales 
from emp 


3. 讨论 

要 把 DEPTNO 和 JOB 值 从 行 形式 变换 成 列 形式 ， 只 要 使 用 CASE 表达 式 把 全 部 可 能 的 值 逐 一 
评估 一 遍 即 可 。 这 是 本 解决 方案 的 要 点 所 在 。 除 此 之 外 ， 如 果 和 希望 删除 一 些 NuLL 行 ， 以 便 
让 整个 报表 显得 “紧密 ”一 些 ， 我 们 还 需要 按照 某 个 列 做 分 组 操作 。 例 如 ， 使 用 窗口 函数 
ROW. NUMBER OVER 为 每 个 DEPTNO 对 应 的 每 个 员工 生成 一 个 序号 ， 然 后 使 用 聚合 函数 MAX 删除 
一 些 Null 值 。 

















select max(case deptno when 10 then ename end) d10, 
max(case deptno when 20 then ename end) d20, 
max(case deptno when 30 then ename end) d30, 
max(case job when 'CLERK' then ename end) clerks, 
max(case job when 'MANAGER' then ename end) mgrs, 
max(case job when 'PRESIDENT' then ename end) prez, 


max(case job when 'ANALYST' then ename end) anals, 
max(case job when 'SALESMAN' then ename end) sales 
from ( 


select deptno, job, ename, 
row number()over(partition by deptno order by empno) rn 


from emp 
)x 
group by rn 
D10 D20 D30 CLERKS MGRS PREZ ANALS SALES 
CLARK SMITH ALLEN SMITH CLARK ALLEN 
KING JONES WARD JONES KING WARD 
MILLER SCOTT MARTIN MILLER SCOTT MARTIN 
ADAMS BLAKE ADAMS BLAKE 
FORD TURNER FORD TURNER 
JAMES JAMES 
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12.17 ”按照 时 间 单 位 分 组 


1. 问题 
你 想 按照 某 种 时 间 间 隔 整 理 数 据 。 例 如 ， 你 有 一 些 交 易 日 志 ， 并 希望 每 隔 5 秒 汇总 一 下 这 
些 数据 。TRX_LoG 表 的 数据 显示 如 下 。 
select trx id, 
trx date, 


trx cnt 
from trx log 





























TRX ID TRX DATE TRX. CNT 
1 28-JUL-2005 19:03:07 44 
2 28-JUL-2005 19:03:08 18 
3 28-JUL-2005 19:03:09 23 
4 28-JUL-2005 19:03:10 29 
5 28-JUL-2005 19:03:11 27 
6 28-JUL-2005 19:03:12 45 
7 28-JUL-2005 19:03:13 45 
8 28-JUL-2005 19:03:14 32 
9 28-JUL-2005 19:03:15 41 
10 28-JUL-2005 19:03:16 15 
11 28-JUL-2005 19:03:17 24 
12 28-JUL-2005 19:03:18 47 
13 28-JUL-2005 19:03:19 37 
14 28-JUL-2005 19:03:20 48 
15 28-JUL-2005 19:03:21 46 
16 28-JUL-2005 19:03:22 44 
17 28-JUL-2005 19:03:23 36 
18 28-JUL-2005 19:03:24 41 
19 28-JUL-2005 19:03:25 33 
20 28-JUL-2005 19:03:26 19 
你 希 回 如 下 所 示 的 结果 集 。 
GRP TRX_START TRX_END TOTAL 
1 28-JUL-2005 19:03:07 28-JUL-2005 19:03:11 141 
2 28-JUL-2005 19:03:12 28-JUL-2005 19:03:16 178 
3 28-JUL-2005 19:03:17 28-JUL-2005 19:03:21 202 
4 28-JUL-2005 19:03:22 28-JUL-2005 19:03:26 173 
2. 解决 方案 





把 全 部 数据 记录 分 别 放 入 若干 个 桶 ， 每 个 桶 里 放 S 行 。 要 实现 这 种 逻辑 分 组 ， 有 几 种 可 能 
的 实现 方式 。 本 实例 的 做 法 是 用 TRX ID 值 除 以 5，12.7 节 曾 使 用 过 该 技巧 。 


创建 好 “分 组 ”之 后 ， 调 用 聚合 函数 MIN. MAX 和 SUM 分 别 计算 出 开始 时 间 、 结 束 时 间 和 每 
个 “分 组 ”的 交易 数目 合计 (如 果 是 SQL Server 的 话 ， 要 记得 用 CEILING 函数 替换 CEIL), 
1 select ceil(trx id/5.0) as grp， 


2 min(trx date) as trx start, 
3 max(trx date) as trx end, 




















4 sum(trx_cnt) as total 
5 from trx_log 
6 group by ceil(trx id/5.0) 


3. 讨论 
首先 要 对 所 有 行 数据 进行 逻辑 分 组 ， 这 是 整个 解决 方案 的 关键 所 在 。TRX_ID 除 以 5， 并 找 
到 大 于 该 商 值 的 最 小 整数 ， 这 样 我 们 就 实现 了 逻辑 分 组 。 例 如 : 


select trx id, 
trx date, 
trx cnt, 
trx id/5.0 as val, 
ceil(trx id/5.0) as grp 
from trx log 








TRX ID TRX DATE TRX CNT VAL GRP 
1 28-JUL-2005 19:03:07 44 .20 1 
2 28-JUL-2005 19:03:08 18 .40 1 
3 28-JUL-2005 19:03:09 23 .60 1 
4 28-JUL-2005 19:03:10 29 .80 1 
5 28-JUL-2005 19:03:11 27 1.00 1 
6 28-JUL-2005 19:03:12 45 1.20 2 
7 28-JUL-2005 19:03:13 45 1.40 2 
8 28-JUL-2005 19:03:14 32 1.60 2 
9 28-JUL-2005 19:03:15 41 1.80 2 

10 28-JUL-2005 19:03:16 15 2.00 2 
11 28-JUL-2005 19:03:17 24 2.20 3 
12 28-JUL-2005 19:03:18 47 2.40 3 
13 28-JUL-2005 19:03:19 37 2.6 3 
14 28-JUL-2005 19:03:20 48 2.80 3 
15 28-JUL-2005 19:03:21 46 3.00 3 
16 28-JUL-2005 19:03:22 44 3.20 4 
17 28-JUL-2005 19:03:23 36 3.40 4 
18 28-JUL-2005 19:03:24 41 3.6 4 
19 28-JUL-2005 19:03:25 33 3.80 4 
20 28-JUL-2005 19:03:26 19 4.00 4 





最 后 ， 调 用 合适 的 聚合 函数 计算 出 每 5 秒 钟 有 多 少 个 交易 ， 同 时 找 出 每 一 组 交易 的 开始 时 
间 和 结束 时 间 。 


select ceil(trx id/5.0) as grp, 





min(trx date) as trx start, 
max(trx date) as trx end, 
sum(trx cnt) as total 


from trx log 
group by ceil(trx id/5.0) 


GRP TRX START TRX END TOTAL 
1 28-JUL-2005 19:03:07 28-JUL-2005 19:03:11 141 
2 28-JUL-2005 19:03:12 28-JUL-2005 19:03:16 178 
3 28-JUL-2005 19:03:17 28-JUL-2005 19:03:21 202 
4 28-JUL-2005 19:03:22 28-JUL-2005 19:03:26 173 
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如 果 输 入 数据 的 格式 与 TRX_L0G 表 有 所 不 同 〈 例 如 缺少 了 ID 列 ) ， 我 们 可 以 用 每 一 行 的 
TRX_DATE 对 应 的 “ 秒 ” 值 除 以 5， 这 样 也 能 生成 和 上 述 解决 方案 类 似 的 分 组 。 然 后 ， 我 们 
可 以 把 每 个 TRX_DATE 对 应 的 “小 时 ”也 一 并 提取 出 来 ， 并 按照 小 时 和 “逻辑 分 组 ”GRP 值 
进行 分 组 。 下 面 的 示例 展示 了 这 一 技巧 (此 处 用 到 了 Oracle 的 TO. CHAR 和 TO. NUMBER 函数 ， 
对 于 其 他 数据 库 需 要 使 用 适当 的 日 期 和 字符 串 格 式 函 数 )。 
select trx_date,trx_cnt, 
to_number(to_char(trx_date,'hh24')) hr, 


ceil(to number(to char(trx date-1/24/60/60,'miss'))/5.0) grp 
from trx log 



































TRX DATE TRX CNT HR GRP 
28-JUL-2005 19:03:07 44 19 62 
28-JUL-2005 19:03:08 18 19 62 
28-JUL-2005 19:03:09 23 19 62 
28-JUL-2005 19:03:10 29 19 62 
28-JUL-2005 19:03:11 27 19 62 
28-JUL-2005 19:03:12 45 19 63 
28-JUL-2005 19:03:13 45 19 63 
28-JUL-2005 19:03:14 32 19 63 
28-JUL-2005 19:03:15 41 19 63 
28-JUL-2005 19:03:16 15 19 63 
28-JUL-2005 19:03:17 24 19 64 
28-JUL-2005 19:03:18 47 19 64 
28-JUL-2005 19:03:19 37 19 64 
28-JUL-2005 19:03:20 48 19 64 
28-JUL-2005 19:03:21 46 19 64 
28-JUL-2005 19:03:22 44 19 65 
28-JUL-2005 19:03:23 36 19 65 
28-JUL-2005 19:03:24 41 19 65 
28-JUL-2005 19:03:25 33 19 65 
28-JUL-2005 19:03:26 19 19 65 





无 论 GRP 的 实际 值 是 多 少 ， 关 键 在 于 我 们 要 把 数据 按照 时 间 分 组 ， 每 5 秒 一 组 。 然 后 调用 
聚合 函数 ， 就 像 最 初 的 解决 方案 那样 。 


select hr,grp,sum(trx_cnt) total 
from ( 
select trx_date,trx_cnt, 
to_number(to_char(trx_date,'hh24')) hr, 
ceil(to number(to char(trx date-1/24/60/60,'miss'))/5.0) grp 
from trx log 
)x 
group by hr,grp 

















HR GRP TOTAL 
19 62 141 
19 63 178 
19 64 202 
19 65 173 


把 TRX_DATE 对 应 的 “小 时 ”也 作为 分 组 列 是 有 特殊 用 意 的 ， 因 为 交易 日 志 可 能 会 分 布 在 相 








邻 的 几 个 小 时 里 。 对 于 DB2 和 Oracle， 我 们 还 可 以 调用 窗口 国 数 SUM OVER 得 





Hist 





EF 的 结果 





集 。 下 面 的 查询 打印 出 了 TRX_L0G 表 的 全 部 数据 ， 并 基于 “逻辑 分 组 ”生成 了 TRX_CNT 的 累 


计 合 计 值 ， 同 时 还 为 “逻辑 分 组 ”的 每 一 行 


select 


\D oo~ ON n + Q) N P 


HL H HH H HH Hui 
NO OO ~ ON t K QQ N B Gc 





trx id, trx date, trx cnt, 
sum(trx cnt)over(partition by ceil(trx id/5.0) 


case when mod(trx id,5.0) 


trx log 
TRX DATE 


28-JUL-2005 
28-JUL-2005 
28-JUL-2005 
28-JUL-2005 
28-JUL-2005 
28-JUL-2005 
28-JUL-2005 
28-JUL-2005 
28-JUL-2005 
28- JUL-2005 
28-JUL-2005 
28-JUL-2005 
28-JUL-2005 
28-JUL-2005 
28-JUL-2005 
28- JUL-2005 
28- JUL-2005 
28-JUL-2005 
28-JUL-2005 


19:03: 





都 计算 出 


order by trx_date 
range between Unbounded preceding 


and current row) runing_total, 
sum(trx cnt)over(partition by ceil(trx id/5.0)) total, 


= 0 then 'X' end grp end 


TRX CNT RUNING TOTAL TOTAL GRP. END 
:07 44 44 141 
:08 18 62 141 
:09 23 85 141 
:10 29 114 141 
11 27 141 141 X 
12 45 45 178 
13 45 90 178 
14 32 122 178 
15 41 163 178 
16 15 178 178 X 
17 24 24 202 
18 47 71 202 
19 37 108 202 
20 48 156 202 
21 46 202 202 X 
22 44 44 173 
23 36 80 173 
24 41 121 173 
:25 33 154 173 
26 19 173 173 X 


N 
© 


28-JUL-2005 


12.48 多 维度 聚合 运算 























HH 了 当前 分 组 的 TRX_CNT 合计 值 TOTAL, 


集 ， 其 中 包括 每 个 员工 的 


1. 问题 
你 想 同 时 进行 不 同 维度 的 聚合 运算 。 例 如 ， 你 希望 得 到 一 个 结果 集 
名 字 、 部 门 、 他 所 在 部 门 的 员工 总 数 (包括 他 自己 )、 (该 合 
计 值 中 也 包括 他 自己 )， 以 及 EMP 表 中 的 员工 总 人 数 。 的 结果 集 如 下 所 示 。 
ENAME DEPTNO DEPTNO_CNT JOB JOB_CNT TOTAL 
MILLER 4 3QEK 0 4 14 
CLARK 10 3 MANAGER 3 14 
KING 10 3 PRESIDENT 1 14 
SCOTT 20 5 ANALYST 2 14 
FORD 20 5 ANALYST 2 14 
SMITH 20 5 CLERK 4 14 
JONES 20 5 MANAGER 3 14 
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ADAMS 20 


JAMES 30 

MARTIN 30 

TURNER 30 

WARD 30 

ALLEN 30 

BLAKE 30 
2. 解决 方案 


5 CLERK 4 14 
6 CLERK 4 14 
6 SALESMAN 4 14 
6 SALESMAN 4 14 
6 SALESMAN 4 14 
6 SALESMAN 4 14 
6 MANAGER 3 14 


有 了 窗口 函数 ， 很 容易 解决 本 问题 。 对 于 不 支持 窗口 函数 的 数据 库 ， 我 们 可 以 使 用 标量 子 





查询 。 


DB2. Oracle 和 SQL Server 
使 用 窗口 函数 COUNT OVER， 按 照 不 同 的 分 区 或 分 组 执行 聚合 运算 。 


select ename, 
deptno, 





count(*)over(partition by deptno) deptno cnt, 


job, 


count(*)over(partition by job) job cnt, 
count(*)over() total 


from emp 


PostgreSQL 和 MySQL 
在 SELECT 列表 里 使 用 标量 子 查询 ， 基 于 不 同 的 分 组 执行 聚合 运算 。 





(select count(*) from emp d 


where d.deptno = e.deptno) as deptno_cnt, 


(select count(*) from emp d 


where d.job = e.job) as job_cnt, 


(select count(*) from emp) as total 


1 select e.ename, 
2 e.deptno, 
3 
4 
5 job, 
6 
7 
8 
9 from emp e 
3. 讨论 


DB2. Oracle 和 SQL Server 








这 个 实例 充分 展示 了 窗口 函数 的 威力 和 方便 性 。 只 要 简单 地 指定 好 不 同 的 聚合 运算 维度 ， 
就 能 轻松 创建 出 非常 详尽 的 报表 ， 不 需要 一 次 又 一 次 的 自 连 接 操 作 ， 也 不 需要 在 SELECT 
列表 中 编写 元 长 笨重 、 性 能 低下 的 子 查询 。 窗 口 国 数 COUNT OVER 就 这 样 独力 完成 了 全 部 工 








作 。 为 了 更 深入 地 到 








EL 


结果， 你 先 仔细 观察 每 个 COUNT 操作 的 OVER FAJ. 





count(*)over(partition by deptno) 


count(*)over(partition by job) 


count(*)over( ) 


请 记 住 OVER 子 句 的 主要 组 成 部 分 : 首先 是 分 区 ， 由 PARTITION BY 指定 ， 然 后 是 帧 (frame) 
或 者 窗口 (window), HH ORDER BY 指定 。 我 们 来 看 第 一 个 COUNT， 它 的 分 区 是 DEPTNO, EMP 








表 的 数据 将 按照 DEPTN0 分 组 ， 并 将 针对 每 个 组 执行 COUNT 操作 。 由 于 没有 指定 帧 或 窗口 子 
名 (没有 ORDER BY) ， 分 组 包含 的 全 部 行 都 会 被 纳入 计数 范围 。PARTITION BY 子 句 会 找 出 所 
有 可 能 的 DEPTN0 值 ， 然 后 调用 COUNT. 函数 统计 每 一 种 DEPTNO 对 应 的 行 数 。 s 
COUNT(*)OVER(PARTITION BY DEPTNO) 中 的 PARTITION BY 子 句 能 够 识别 出 的 分 区 值 会 

20 和 30, 


第 二 个 COUNT 的 处 理 过 程 也 是 如 此 ， 只 不 过 这 次 要 按照 JOB 分 区 。 最 后 一 个 COUNT 并 没有 
指定 任何 分 区 ， 只 放 了 一 个 空 括号 。 空 括号 是 指 “ 整 张 表 "。 因 此 ， 虽 然 前 两 个 COUNT 基于 
指定 的 分 组 或 分 区 进行 聚合 运算 ， 最 后 一 个 COUNT 则 会 计算 出 整个 EMP 表 的 行 数 。 






































请 记 住 WHERE 子 名 执行 过 后 窗口 函数 才 会 被 评估 执行 。 如 果 我 们 使 用 WHRE 条 
JO rien Ti 例如 删除 了 DEPTNO 等 于 10 的 员工 ， 那 么 TOTAL fi 

“将 变 成 11， 而 不 再 是 14。 窗 口 函 数 执行 过 后 若 还 想 再 做 一 些 结果 过 滤 ， 就 必 
须 把 窗口 函数 查询 放 进 内 稀 视 图 ， 并 从 该 视图 中 删除 我 们 不 希望 看 到 的 数据 。 
































PostgreSQL 和 MySQL 
对 于 主 查询 返回 的 每 一 行 数据 (EMP E 中 的 行 )， 在 SELECT 列表 里 使 用 多 个 标量 子 查 询 基 
于 每 个 DEPTNO 和 JOB 生成 不 同 的 计数 值 。 为 得 到 TOTAL 值 ， 只 要 再 写 一 个 标量 子 查 询 获取 
EMP 表 的 员工 总 人 数 即 可 。 


12.19 ”动态 区 间 聚 合 运算 


1. 问题 

你 想 执行 动态 的 聚合 运算 ， 例 如 计算 EMP 表 工 资 的 动态 合计 。 你 希望 把 入 职 最 早 的 员工 的 
HIREDATE 作为 起 始点 ， 每 隔 90 天 计算 一 次 工资 合计 值 。 你 想 调 查 一 下 在 最 早 入 职 的 员工 
和 最 近 入 职 的 员工 之 间 每 隔 90 天 工资 的 波动 状况 。 你 希望 得 到 如 下 所 示 的 结果 集 。 











HIREDATE SAL SPENDING_PATTERN 
17-DEC-1980 800 800 
20-FEB-1981 1600 2400 
22-FEB-1981 1250 3650 
02-APR-1981 2975 5825 
01-MAY-1981 2850 8675 
09-JUN-1981 2450 8275 
08-SEP-1981 1500 1500 
28-SEP-1981 1250 2750 
17-NOV-1981 5000 7750 
03-DEC-1981 950 11700 
03-DEC-1981 3000 11700 
23-JAN-1982 1300 10250 
09-DEC-1982 3000 3000 
12-JAN-1983 1100 4100 
pain 





部 分 数据 库 支持 在 窗口 函数 的 帧 或 窗口 子 句 中 指定 动态 窗口 ， 这 样 一 来 本 问题 的 解决 就 变 
o 关键 之 处 在 于 调用 窗口 函数 时 要 按照 HIREDATE 排序 ， 并 指定 一 个 为 期 90 天 的 
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日 期 窗口 ， 该 日 期 窗口 的 起 始点 是 第 一 个 员工 的 入 职 日 期 。 工 资 合 计 值 的 计算 针对 的 是 一 
组 动态 变化 的 员工 ， 包 括 当 前 员工 ， 以 及 入 职 时 间 早 于 当前 员工 但 相差 不 超过 90 天 的 所 有 
人 。 对 于 不 支持 这 一 类 窗口 国 数 的 数据 库 ， 可 以 使 用 标量 子 查 询 ， 做 法 自然 稍 显 党 琐 。 


DB2 和 Oracle 

对 于 DB2 和 Oracle， 使 用 窗口 国 数 SUM OVER， 并 按照 HIREDATE 排序 。 在 窗口 或 “ 帧 ” 子 名 
里 指定 时 间 范 围 为 90 天， 这 样 就 能 针对 每 个 员工 以 及 入 职 时 间 比 他 早 90 天 以 内 的 所 有 人 
的 工资 执行 合计 计算 。 因 为 DB2 的 窗口 函数 不 支持 在 ORDER BY 子 句 中 指定 HIREDATE (下 
下 第 3 行 代 码 ) ， 我 们 只 好 改 用 ORDERY BY DAYS(HIREDATE), 
































1 select hiredat, 

2 sal, 

3 sum(sal)over(order by days(hiredate) 

4 range between 90 preceding 

5 and current row) spending pattern 
6 from emp e 





相 较 于 DB2 解决 方案 ，Oracle 解决 方案 更 加 简洁 明了 ， 因 为 Oracle 的 窗口 函数 支持 DATE 
类 型 排序 。 





1 select hiredate, 

2 sal, 

3 sum(sal)over(order by hiredate 

4 range between 90 preceding 

5 and current row) spending_pattern 
6 from emp e 


MySQL. PostgreSQL 和 SQL Server 
使 用 标量 子 查询 计算 工资 合计 值 ， 合 计 值 的 计算 范围 包括 当前 员工 ， 以 及 入 职 时 间 早 于 当 
前 员工 但 相差 不 超过 90 天 的 所 有 人 。 














[ut 





1 select e.hiredate, 

2 e.sal, 

3 (select sum(sal) from emp d 

4 where d.hiredate between e.hiredate-90 

5 and e.hiredate) as spending pattern 
6 from emp e 
7 order by 1 


3. 讨论 

DB2 和 Oracle 

DB2 和 Oracle 的 解决 方案 大 致 相同 。 两 者 差别 极 小 ,唯一 的 不 同 之 处 在 于 窗口 函数 的 ORDER 
BY 子 句 如 何 操作 HIREDATE。 在 写作 本 书 时 ， 如 果 想 通过 一 个 数值 来 指定 窗口 的 范围 ，DB2 
是 不 支持 在 ORDER BY 子 句 中 使 用 DATE 类 型 的 。( 例 如 ，RANGE BETNEEN UNBOUNDED PRECEDING 
AND CURRENT ROW 支持 日 期 类 型 的 排序 ， 但 RANGE BETWEEN 90 PRECEDING AND CURRENT ROW 却 不 
支持 这 么 做 。) 

掌握 本 解决 方案 的 关键 是 要 了 解 查询 语句 中 窗口 子 句 的 工作 原理 。 首 先 ， 我 们 定义 好 的 窗 
口 会 按照 HIREDATE 对 所 有 员工 的 工资 进行 排序 。 然 后 ， 调 用 聚合 国 数 计算 工资 总 额 。 但 
是 ， 这 里 计算 出 的 并 不 是 所 有 工资 的 总 和 。 有 具体 的 处 理 过 程 如 下 所 示 。 
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(评估 最 早 入 职 的 员工 的 工资 。 第 一 个 员工 入 职 之 前 不 会 有 其 他 人 已 经 人 职 ， 因 而 此 时 的 
工资 总 额 就 是 第 一 个 员工 的 工资 。 
(2) (按照 HIREDATE 的 先后 顺序 ) 评估 下 一 位 员工 的 工资 。 该 员工 的 工资 会 被 计 入 动态 工资 





合计 值 ，# 





其 他 入 职 时 间 比 他 早 、 但 相差 90 天 以 内 的 员工 的 工资 也 会 被 计 入 合计 值 。 


第 一 个 员工 的 HIREDATE 是 1980 年 12 月 17 日 ， 紧 接着 入 职 的 下 一 位 员工 的 HIREDATE 是 
1981 年 2 月 20 日。 第 二 个 员工 的 入 职 日 期 和 第 一 个 员工 相差 不 足 90 天 ， 因 此 第 二 个 员工 
对 应 的 动态 工资 合计 值 等 于 2400 (1600 + 800)。 为 了 更 深入 地 理解 SPENDING PATTERN 列 的 
计算 方法 ， 不 妨 仔 细 观 察 下 面 的 查询 语句 及 其 结果 和 集 。 


select distinct 
dense_rank()over(order by e.hiredate) window, 


e 
d 




















.hiredate current_hiredate, 
.hiredate hiredate within, 90 days, 


d.sal sals, used for sum 
from emp e, 
emp d 
where d.hiredate between e.hiredate-90 and e.hiredate 


WINDOW CURRENT HIREDATE HIREDATE WITHIN 90 DAYS SALS USED FOR SUM 


1 17-DEC-1980 17-DEC-1980 800 
2 20-FEB-1981 17-DEC-1980 800 
2 20-FEB-1981 20-FEB-1981 1600 
3 22-FEB-1981 17-DEC-1980 800 
3 22-FEB-1981 20-FEB-1981 1600 
3 22-FEB-1981 22-FEB-1981 1250 
4 02-APR-1981 20-FEB-1981 1600 
4 02-APR-1981 22-FEB-1981 1250 
4 02-APR-1981 02-APR-1981 2975 
5 01-MAY-1981 20-FEB-1981 1600 
5 01-MAY-1981 22-FEB-1981 1250 
5 01-MAY-1981 02-APR-1981 2975 
5 01-MAY-1981 01-MAY-1981 2850 
6 09-JUN-1981 02-APR-1981 2975 
6 09-JUN-1981 01-MAY-1981 2850 
6 09-JUN-1981 09- JUN- 1981 2450 
7 08-SEP-1981 08-SEP-1981 1500 
8 28-SEP-1981 08-SEP-1981 1500 
8 28-SEP-1981 28-SEP-1981 1250 
9 17-NOV-1981 08-SEP-1981 1500 
9 17-NOV-1981 28-SEP-1981 1250 
9 17-NOV-1981 17-NOV-1981 5000 
10 03-DEC-1981 08-SEP-1981 1500 
10 03-DEC-1981 28-SEP-1981 1250 
10 03-DEC-1981 17-NOV-1981 5000 
10 03-DEC-1981 03-DEC-1981 950 
10 03-DEC-1981 03-DEC-1981 3000 
11 23-JAN-1982 17-NOV-1981 5000 
11 23-JAN-1982 03-DEC-1981 950 
11 23-JAN-1982 03-DEC-1981 3000 
11 23-JAN-1982 23-JAN- 1982 1300 
12 09-DEC-1982 09-DEC-1982 3000 
13 12-JAN-1983 09-DEC-1982 3000 
13 12-JAN-1983 12-JAN-1983 1100 
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仔细 看 WINDOW 列 的 话 ， 我 们 会 发 现 具有 相同 WINDOW 值 的 行 会 被 计 入 动态 工资 合计 值 。 以 
WINDOW 值 等 于 3 的 那 一 组 为 例 ， 该 窗口 中 被 计 入 合计 的 工资 分 别 是 800. 1600 和 1250, 合 
计 为 3650。 回 头 再 看 一 下 “问题 ”部 分 给 出 的 最 终结 果 集 ， 我 们 看 到 1981 £2 H 22H 
(WINDOW 3) 那 一 行 的 SPENDING PATTERN 值 确实 是 3650。 如 果 想 证 明 自 连接 查询 为 每 个 窗口 
都 找到 了 正确 的 工资 ， 我 们 只 要 按照 CURRENT_DATE 分 组 ， 并 把 SALS_USED_FOR_SUM 值 相 加 
求 和 即 可 。 查 询 结 果 应 该 会 和 “问题 ”部 分 给 出 的 结果 和 集 相 一 致 (1981 年 12 月 3 日 对 应 
的 结果 本 应 有 两 行 ， 但 这 里 把 重复 行 去 掉 了 )。 


select current hiredate, 
sum(sals used for sum) spending, pattern 
from ( 
select distinct 
dense rank()over(order by e.hiredate) window, 
e.hiredate current hiredate, 
d.hiredate hiredate within 90 days, 
d.sal sals, used for sum 
from emp e, 
emp d 
where d.hiredate between e.hiredate-90 and e.hiredate 
)x 


group by current hiredate 
























































CURRENT HIREDATE SPENDING PATTERN 


17-DEC-1980 800 
20-FEB-1981 2400 
22-FEB-1981 3650 
02-APR-1981 5825 
01-MAY-1981 8675 
09- JUN- 1981 8275 
08-SEP-1981 1500 
28-SEP-1981 2750 
17-NOV-1981 7750 
03-DEC-1981 11700 
23-JAN-1982 10250 
09-DEC-1982 3000 
12-JAN-1983 4100 


MySQL, PostgreSQL 和 SQL Server 

基于 HIREDATE 排序 ， 并 使 用 聚合 国 数 SUM 以 计算 出 每 90 天 的 工资 合计 值 。 除 此 之 外 ， 本 
解决 方案 的 关键 之 处 还 包括 标量 子 查 询 的 运用 ( 自 连接 查询 也 能 达到 同样 目的 )。 为 了 方 
便 你 理解 ， 不 妨 把 本 解决 方案 先 转换 成 自 连接 查询 ， 并 仔细 观察 哪些 行 会 被 包含 进 求 和 计 
算 。 考 虑 如 下 所 示 的 结果 集 ， 它 的 查询 结果 和 前 面 给 出 的 解决 方案 相同 。 


select e.hiredate, 
e.sal, 
sum(d.sal) as spending pattern 
from emp e, emp d 
where d.hiredate 
between e.hiredate-90 and e.hiredate 
group by e.hiredate,e.sal 
order by 1 






























































HIREDATE SAL SPENDING_PATTERN 


17-DEC-1980 800 800 
20-FEB-1981 1600 2400 
22-FEB-1981 1250 3650 
02-APR-1981 2975 5825 
01-MAY-1981 2850 8675 
09-JUN-1981 2450 8275 
08-SEP-1981 1500 1500 
28-SEP-1981 1250 2750 
17-NOV-1981 5000 7750 
03-DEC-1981 950 11700 
03-DEC-1981 3000 11700 
23-JAN-1982 1300 10250 
09-DEC-1982 3000 3000 
12-JAN-1983 1100 4100 




















如 果 上 述 输出 结果 依然 不 够 清楚 明白 ， 不 妨 删除 分 组 和 聚合 运算 部 分 ， 先 打印 出 笛 卡 儿 积 
的 结果 。 首 先 使 用 EMP 表 产 生 一 个 笛 卡 儿 积 以 便 每 个 HIREDATE 都 可 以 和 其 他 HIREDATE 进 
行 比较 。( 下 面 只 打印 出 了 部 分 结果 集 ， 因 为 EMP 表 的 笛 卡 儿 积 会 返回 196 47 (14x 14) 
数据 。) 
select e.hiredate, 
e.sal, 
d.sal, 


d.hiredate 
from emp e, emp d 














HIREDATE SAL SAL HIREDATE 

17-DEC-1980 | 800 800 17-DEC-1980 
17-DEC-1980 800 1600 20-FEB-1981 
17-DEC-1980 800 1250 22-FEB-1981 
17-DEC-1980 800 2975 02-APR-1981 
17-DEC-1980 800 1250 28-SEP-1981 
17-DEC-1980 800 2850 01-MAY-1981 
17-DEC-1980 800 2450 09-JUN-1981 
17-DEC-1980 800 3000 09-DEC-1982 
17-DEC-1980 800 5000 17-NOV-1981 
17-DEC-1980 | 800 1500 08-SEP-1981 
17-DEC-1980 800 1100 12-JAN-1983 
17-DEC-1980 | 800 950 03-DEC-1981 
17-DEC-1980 800 3000 03-DEC-1981 
17-DEC-1980 800 1300 23-JAN-1982 
20-FEB-1981 1600 800 17-DEC-1980 
20-FEB-1981 1600 1600 20-FEB-1981 
20-FEB-1981 1600 1250 22-FEB-1981 
20-FEB-1981 1600 2975 02-APR-1981 
20-FEB-1981 1600 1250 28-SEP-1981 
20-FEB-1981 1600 2850 01-MAY-1981 
20-FEB-1981 1600 2450 09-JUN-1981 
20-FEB-1981 1600 3000 09-DEC-1982 
20-FEB-1981 1600 5000 17-NOV-1981 
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20-FEB-1981 1600 1500 08-SEP-1981 
20-FEB-1981 1600 1100 12-JAN-1983 
20-FEB-1981 1600 950 03-DEC-1981 
20-FEB-1981 1600 3000 03-DEC-1981 
20-FEB-1981 1600 1300 23-JAN-1982 




















仔细 查看 上 述 结果 集 可 以 发 现 ， 除 了 其 自身 ， 不 存在 比 1980 年 12 H 17 日 更 早 的 HIREDATE, 
因此 ， 那 一 行 对 应 的 合计 值 应 该 是 800。 然 后 是 下 一 个 HIREDATE, 19814E 2 H 20 H, 我 
们 注意 到 只 有 一 个 HIREDATE 落 在 了 90 天 的 窗口 范围 内 ( 比 该 日 期 早 90 天 )， 那 就 是 1980 
年 12 月 17 日 。 为 1980 年 12 月 17 日 对 应 的 SAL 值 和 1981 年 2 月 20 对 应 的 SAL 值 求 和 ， 
结果 是 2400 (因为 我 们 寻找 的 是 当前 HIREDATE 以 及 90 天 之 内 的 日 期 )， 这 恰好 就 是 最 终 



































结果 集 该 HIREDATE 对 应 的 工资 合计 值 。 


现在 我 们 已 经 理解 具体 的 做 法 了 ， 接 着 在 WHERE -T- 5) H 
HIREDATE 以 及 早 于 该 HIREDATE 90 天 以 内 的 日 期 。 


select e.hiredate, 
e.sal, 
d.sal sal_to_sunm, 
d.hiredate within, 90 days 
from emp e, emp d 
where d.hiredate 
between e.hiredate-90 and e.hiredate 


order by 1 

HIREDATE SAL SAL TO SUM WITHIN 90 DAYS 
17-DEC-1980 800 800 17-DEC-1980 
20-FEB-1981 1600 800 17-DEC-1980 
20-FEB-1981 1600 1600 20-FEB-1981 
22-FEB-1981 1250 800 17-DEC-1980 
22-FEB-1981 1250 1600 20-FEB-1981 
22-FEB-1981 1250 1250 22-FEB-1981 
02-APR-1981 2975 1600 20-FEB-1981 
02-APR-1981 2975 1250 22-FEB-1981 
02-APR-1981 2975 2975 02-APR-1981 
01-MAY-1981 2850 1600 20-FEB-1981 
01-MAY-1981 2850 1250 22-FEB-1981 
01-MAY-1981 2850 2975 02-APR-1981 
01-MAY-1981 2850 2850 01-MAY-1981 
09-JUN-1981 2450 2975 02-APR-1981 
09-JUN-1981 2450 2850 01-MAY-1981 
09-JUN-1981 2450 2450 09-JUN- 1981 
08-SEP-1981 1500 1500 08-SEP-1981 
28-SEP-1981 1250 1500 08-SEP-1981 
28-SEP-1981 1250 1250 28-SEP-1981 
17-NOV-1981 5000 1500 08-SEP-1981 
17-NOV-1981 5000 1250 28-SEP-1981 
17-NOV-1981 5000 5000 17-NOV-1981 
03-DEC-1981 950 1500 08-SEP-1981 
03-DEC-1981 950 1250 28-SEP-1981 
03-DEC-1981 950 5000 17-NOV-1981 
03-DEC-1981 950 950 03-DEC-1981 
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03-DEC-1981 950 3000 03-DEC-1981 


03-DEC-1981 3000 1500 08-SEP-1981 
03-DEC-1981 3000 1250 28-SEP-1981 
03-DEC-1981 3000 5000 17-NOV-1981 
03-DEC-1981 3000 950 03-DEC-1981 
03-DEC-1981 3000 3000 03-DEC-1981 
23-JAN-1982 1300 5000 17-NOV-1981 
23-JAN-1982 1300 950 03-DEC-1981 
23-JAN-1982 1300 3000 03-DEC-1981 
23-JAN-1982 1300 1300 23-JAN-1982 
09-DEC-1982 3000 3000 09-DEC-1982 
12-JAN-1983 1100 3000 09-DEC-1982 
12-JAN-1983 1100 1100 12-JAN-1983 





现在 我 们 能 清楚 地 看 到 哪些 SAL 值 会 被 计 入 合计 值 了 ， 接 下 来 只 要 调用 聚合 函数 SUM 生成 
最 终结 果 集 即 可 。 


select e.hiredate, 
e.sal, 
sum(d.sal) as spending_pattern 
from emp e, emp d 
where d.hiredate 
between e.hiredate-90 and e.hiredate 
group by e.hiredate,e.sal 
order by 1 


比较 上 述 查 询 和 下 面 的 查询 〈 本 例 给 出 的 标量 子 查询 解决 方案 ) 的 结果 集 ， 我 们 会 发 现 它 
们 甚 实 是 相同 的 。 


select e.hiredate, 
e.sal, 
(select sum(sal) from emp d 
where d.hiredate between e.hiredate-90 
and e.hiredate) as spending pattern 
































from emp e 

order by 1 
HIREDATE SAL SPENDING PATTERN 
17-DEC-1980 800 800 
20-FEB-1981 1600 2400 
22-FEB-1981 1250 3650 
02-APR-1981 2975 5825 
01-MAY-1981 2850 8675 
09-JUN-1981 2450 8275 
08-SEP-1981 1500 1500 
28-SEP-1981 1250 2750 
17-NOV-1981 5000 7750 
03-DEC-1981 950 11700 
03-DEC-1981 3000 11700 
23-JAN-1982 1300 10250 
09-DEC-1982 3000 3000 
12-JAN-1983 1100 4100 
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12.20 ”变换 带 有 小 计 的 结果 集 

1. 问题 

你 想 创建 一 个 包含 小 计 的 报表 ， 并 希望 把 该 结果 重新 格式 化 ， 使 之 更 具 可 读 性 。 例 如 ， 你 
已 经 按照 要 求 创建 了 一 张 报表 ， 其 中 包含 每 个 部 门 的 所 有 管理 者 ， 以 及 每 个 管理 者 下 属 所 
有 员工 的 工资 合计 值 。 同 时 ， 你 也 希望 能 看 到 两 种 额外 的 小 计 : 去 掉 管 理 者 之 后 、 每 个 部 
门 的 所 有 下 属 员工 的 工资 总 额 ， 以 及 上 述 结果 和 集中 所 有 工资 的 合计 值 〈 在 部 门 工资 小 计 的 
基础 上 再 求 和 ， 得 出 总 计 )。 现 在 ， 你 得 到 的 报表 如 下 所 示 。 























DEPTNO MGR SAL 
10 7782 1300 
10 7839 2450 
10 3750 
20 7566 6000 
20 7788 1100 
20 7839 2975 
20 7902 800 
20 10875 
30 7698 6550 
30 7839 2850 
30 9400 

24025 


你 想 提供 一 个 更 具 可 读 性 的 报表 ， 因 此 希望 把 上 述 结果 转换 成 如 下 所 示 的 形式 ， 以 便 更 清 
楚 明白 地 表达 每 个 小 计 的 含义 。 








MGR DEPT10 DEPT20 DEPT30 TOTAL 
7566 0 6000 0 
7698 0 0 6550 
7782 1300 0 0 
7788 0 1100 0 
7839 2450 2975 2850 
7902 0 800 0 
3750 10875 9400 24025 
2. 解决 方案 


首先 使 用 GROUP BY 的 ROLLUP 扩展 生成 小 计 ， 接 着 执行 一 次 结果 集 变 换 (使 用 聚合 运算 和 
CASE 表达 式 ) 以 创建 出 新 报表 所 需 的 列 。GROUPING 函数 能 帮助 我 们 方便 地 识别 出 哪些 是 
小 计 (也 就 是 说 ， 小 计 都 是 由 ROLLUP 产生 出 来 的 ， 正 常 的 GROUP BY 无 法 生成 小 计 )。 由 于 
不 同 的 数据 库 对 Null 排序 的 处 理 方式 各 有 不 同 ， 我 们 可 能 需要 为 某 些 解 决 方案 增加 ORDER 
BY， 以 便 最 终 的 结果 集 和 上 述 目标 结果 集 相 一 致 。 

DB2 和 Oracle 

使 用 GROUP BY 的 ROLLUP 扩展 ， 然 后 借助 CASE 表达 式 把 数据 格式 化 成 更 具 可 读 性 的 报表 。 


1 select mgr， 
2 sum(case deptno when 10 then sal else 0 end) dept10, 
3 sum(case deptno when 20 then sal else 0 end) dept20, 
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sum(case deptno when 30 then sal else 0 end) dept30, 
sum(case flag when '11' then sal else null end) total 
from ( 

select deptno,mgr,sum(sal) sal, 
cast(grouping(deptno) as char(1))|| 

9 cast(grouping(mgr) as char(1)) flag 

10 from emp 

11 where mgr is not null 

12 group by rollup(deptno,mgr) 

13 )x 

14 group by mgr 


co — OA 人 上 


SQL Server 
使 用 GROUP BY 的 ROLLUP 扩展 ， 然 后 借助 CASE 表达 式 把 数据 格式 化 成 更 具 可 读 性 的 报表 。 


1 select mgr, 

2 sum(case deptno when 10 then sal else 0 end) dept10, 
3 sum(case deptno when 20 then sal else 0 end) dept20, 
4 sum(case deptno when 30 then sal else 0 end) dept30, 
5 sum(case flag when '11' then sal else null end) total 
6 from ( 

7 select deptno,mgr,sum(sal) sal, 

8 cast(grouping(deptno) as char(1))+ 

9 cast(grouping(mgr) as char(1)) flag 

10 from emp 

11 where mgr is not null 

12 group by deptno,mgr with rollup 

13 )x 

14 group by mgr 


MySQL 和 PostgreSQL 

这 两 种 数据 库 都 不 支持 GROUPING 函数 。 
3. 讨论 

以 上 两 种 解决 方案 大 致 相同 ， 但 在 字符 串 连 接 和 GROUPING 函数 调用 的 方式 上 略 有 不 同 。 由 
于 它们 非常 相似 ， 下 面 的 讨论 部 分 在 展示 中 间 结 果 的 时 候 将 以 SQL Server 解决 方案 为 准 
(也 会 兼顾 DB2 和 Oracle), 


首先 为 每 个 DEPTNO 的 每 个 MGR 计算 出 其 下 属 员 工 的 SAL 合计 值 。 基 本 的 想法 是 希望 打印 出 
某 个 部 门 特 定 管 理 者 下 属 所 有 员工 的 工资 合计 值 。 例 如 ， 下 面 的 查询 可 以 比较 KING 下 属 
的 DEPTNO 10 和 DEPTN0 30 的 所 有 员工 的 工资 。 


select deptno,mgr,sum(sal) sal 
from emp 

where mgr is not null 

group by mgr,deptno 

order by 1,2 




































































DEPTNO MGR SAL 
10 7782 1300 
10 7839 2450 
20 7566 6000 
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20 
20 
20 
30 
30 


7788 
7839 
7902 
7698 
7839 


1100 
2975 

800 
6550 
2850 


然后 使 用 GROUP BY 的 ROLLUP 扩展 ， 


括 最 高 


计算 


管理 者 ) 的 工资 总 额 


计算 每 个 DEPTN0 对 应 的 工资 小 计 以 及 全 体 员 工 ( 


select deptno,mgr,sum(sal) sal 


from emp 


where mgr is not null 


group by deptno,mgr with rollup 


DEPTNO 








出 了 小 计 之 后 ， 我 们 需要 知道 如 何 判 断 哪 些 值 是 〈 由 ROLLUP 产生 的 ) 小 计 ， 哪 些 值 











TIT 





由 正常 的 GROUP BY 产生 的 结果 。 使 用 GROUPING 函数 创建 位 图 可 以 把 小 计 从 正常 的 聚合 运 


值 中 分 离 





出 来 。 


select deptno,mgr,sum(sal) sal, 
cast(grouping(deptno) as char(1))+ 
cast(grouping(mgr) 


from emp 


where mgr is not null 


as char(1)) flag 


group by deptno,mgr with rollup 


DEPTNO 


SAL 


FLAG 


不 包 


H 
zÉ 


e 
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如 果 要 讲 得 更 清楚 明白 一 点 的 话 ， 就 是 FLAG 值 等 于 00 的 行 都 是 正常 的 聚合 运算 结果 。 
FLAG 值 等 于 01 的 行 是 由 ROLLUP 生成 的 、 每 个 DEPTNO 的 SAL 合计 值 (因为 DEPTNO 是 ROLLUP 
的 第 一 个 参数 ， 如 果 变 换 一 下 顺序 ， 例 如 改 为 “GROUP BY MGR, DEPTNO WITH ROLLUP”， 结 果 会 
KIHE). FLAG 值 等 于 11 的 行 是 由 ROLLUP 产生 的 、 所 有 SAL 的 合计 值 。 


现在 ， 所 需 的 数据 都 已 经 准备 好 了 ， 接 下 来 要 使 用 CASE 表达 式 把 它们 重新 格式 化 为 一 个 更 
直观 的 结果 集 。 我 们 的 目标 是 为 跨 部 门 的 每 位 管理 者 显示 其 下 属 员工 的 工资 合计 值 。 如 果 
一 位 管理 者 在 某 个 部 门 没 有 下 属 员工 ， 那 就 返回 0， 否则， 将 返回 该 管理 者 在 给 定 部 门 所 
有 下 属 员工 的 工资 合计 值 。 除 此 之 外 ， 我 们 还 要 在 报表 的 最 后 面 增加 一 个 TOTAL 列 以 打印 
报表 中 全 部 工资 的 总 计 。 满 足 上 述 所 有 要 求 的 解决 方案 如 下 所 示 。 


select mgr， 
sum(case deptno when 10 then sal else 0 end) dept10, 
sum(case deptno when 20 then sal else 0 end) dept20, 
sum(case deptno when 30 then sal else 0 end) dept30, 
sum(case flag when '11' then sal else null end) total 
from ( 
select deptno,mgr,sum(sal) sal, 
cast(grouping(deptno) as char(1) )+ 
cast(grouping(mgr) as char(1)) flag 
from emp 
where mgr is not null 
group by deptno,mgr with rollup 
)x 
group by mgr 
order by coalesce(mgr,9999) 














































































































MGR DEPT10 DEPT20 DEPT30 TOTAL 
7566 0 6000 0 
7698 0 0 6550 
7782 1300 0 0 
7788 0 1100 0 
7839 2450 2975 2850 
7902 0 800 0 
3750 10875 9400 24025 
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本 章 介 绍 的 实例 展现 了 数据 中 可 能 存在 的 层次 关系 。 通 常 而 言 ， 以 层次 关系 的 形式 访问 
并 展示 数据 相 较 于 存储 这 些 数 据 要 困难 得 多 。 而 且 ， 由 于 SQL 缺乏 足够 的 弹性 (SQL 的 非 
递归 性 质 ) ， 更 使 得 这 种 状况 雪上 加 霜 。 当 涉及 层次 查询 时 ， 充 分 利用 关系 数据 库 管理 系 
统 提 供 的 相关 特性 毫 无 疑问 是 非常 重要 的 ， 否 则 在 耗费 了 大 量 时 间 和 精力 构造 出 复杂 、 费 
解 的 数据 模型 ， 并 编写 出 了 一 些 低 效 的 查询 语句 之 后 ， 我 们 可 能 会 最 终 发 现 这 些 都 无 济 于 
事 。 对 于 PostgreSQL 用 户 ， WITH 递归 查询 很 可 能 会 被 加 入 到 后 续 的 版 本 里 ， 因 此 不 妨 关 注 
一 下 本 章 给 出 的 DB2 解 决 方案 。 

本 章 提 供 的 实例 将 充分 利用 各 种 关系 数据 库 管 理 系 统 提 供 的 函数 把 具有 层次 结构 的 数据 分 
解 开 。 在 开始 讲述 具体 的 实例 之 前 ， 我 们 先 来 看 一 下 EM 表 以 及 EMPNO 和 MGR 之 间 的 层次 


select empno,mgr 


















































from emp 

order by 2 
EMPNO MGR 
7788 7566 
7902 7566 
7499 7698 
7521 7698 
7900 7698 
7844 7698 
7654 7698 
7934 7782 
7876 7788 
7566 7839 
7782 7839 
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7698 7839 
7369 7902 
7839 


如 果 仔 细 观 察 的 话 ， 我 们 会 发 现 MGR 值 其 实 也 是 一 个 EMPNO。 也 就 是 说 ， 每 个 员工 的 管理 
者 也 会 作为 一 个 员工 存在 于 EMP 表 里 ， 他 们 并 没有 被 存储 到 其 他 地 方 。MGR 和 EMPNO 之 间 
的 关系 类 似 于 父子 关系 ， 对 于 每 一 个 给 定 的 EMPNO， 它 对 应 的 MOR 值 就 是 他 的 直接 父 节点 。 
(一 个 员工 的 管理 者 也 可 能 会 有 更 高 级 的 管理 者 ， 以 此 类 推 ， 这 就 产生 一 个 多 层 的 结构 。) 
对 于 没有 管理 者 的 员工 ， 他 的 MGR 值 就 是 Null, 


13.1 展现 父子 关系 


1. 问题 
你 想 找 出 子 节 点 对 应 的 父 节 点 信息 。 例 如 ， 你 希望 显示 每 个 员工 及 其 管理 者 的 名 字 。 你 希 
望 返 回 的 结果 集 如 下 所 示 。 


EMPS_AND_MGRS 

FORD works for JONES 
SCOTT works for JONES 
JAMES works for BLAKE 
TURNER works for BLAKE 
MARTIN works for BLAKE 
WARD works for BLAKE 
ALLEN works for BLAKE 
MILLER works for CLARK 
ADAMS works for SCOTT 
CLARK works for KING 
BLAKE works for KING 
JONES works for KING 
SMITH works for FORD 


2. 解决 方案 

基于 MGR 和 EMPN0 对 EMP 表 做 自 连接 查询 ， 找 出 每 个 员工 的 管理 者 的 名 字 。 然 后 使 用 数据 
库 提 供 的 字符 串 连 接 函 数 生成 符合 要 求 的 字符 串 。 

DB2. Oracle 和 PostgreSQL 

自 连 接 EMP 表 。 然 后 使 用 双 紧 线 || 连接 字符 串 。 
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1 select a.ename || ' works for ' 
2 from emp a, emp b 


3 where a.mgr = b.empno 


|| b.ename as emps and mgrs 


MySQL 
自 连 接 EMP 表 ， 然 后 使 用 CONCAT 函数 连接 字符 串 。 
1 select concat(a.ename, ' works for ',b.ename) as emps_and_mgrs 


2 from emp a, emp b 
3 where a.mgr = b.empno 
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SQL Server 
自 连接 EMP 表 ， 然 后 使 用 加 号 “+” 连 接 字符 上 





HH 








° 


1 select a.ename + ' works for 


2 from emp a, emp b 
3 where a.mgr = b.empno 


3. 讨论 

以 上 所 有 解决 方案 的 实现 思路 大 致 相同 。 不 同 之 处 仅 在 于 字符 串 连接 的 方式 ， 所 以 下 面 的 
讨论 能 够 兼顾 到 所 有 的 解决 方案 ， 不 用 再 一 一 解释 每 一 个 具体 的 做 法 。 

基于 MGR 和 EMPNO 的 连接 查询 是 关键 所 在 。 首 先 通过 自 连 接 EMP 表 创 建 一 个 第 卡 儿 积 (下 
下 只 显示 了 笛 卡 儿 积 返回 值 的 一 部 分 )。 


select a.empno, b.empno 
from emp a, emp b 


+ b.ename as emps_and_mgrs 
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EMPNO MGR 
7369 7369 
7369 7499 
7369 7521 
7369 7566 
7369 7654 
7369 7698 
7369 7782 
7369 7788 
7369 7839 
7369 7844 
7369 7876 
7369 7900 
7369 7902 
7369 7934 
7499 7369 
7499 7499 
7499 7521 
7499 7566 
7499 7654 
7499 7698 
7499 7782 
7499 7788 
7499 7839 
7499 7844 
7499 7876 
7499 7900 
7499 7902 
7499 7934 


如 上 所 示 ， 第 卡 儿 积 返回 了 每 一 种 可 能 的 EMPNO/EMPNO 组 合 。( 这 样 看 起 来 所 有 人 都 是 
EMPNO 7369 的 管理 者 ， 甚 至 也 包括 7369 本 人 。) 

下 一 步 要 过 滤 结 果 集 ， 以 便 只 返回 每 个 员工 及 其 管理 者 的 EMPNO。 增 加 MGR 和 EMPNO 相等 
的 判断 条 件 即 可 。 





























1 
2 
3 


select a.empno, b.empno mgr 
from emp a, emp b 
where a.mgr = b.empno 


现在 已 经 得 到 了 每 
者 的 名 字 即 可 。 如 有 果 你 还 没有 完全 理解 本 解决 方案 的 原理 ， 那 么 可 以 先 忽 略 自 连接 方案 ， 





Hf 


BET D. 


select a.ename, 
(select b.ename 
from emp b 
where b.empno = a.mgr) as mgr 


from emp 


a 


员工 及 其 管理 者 的 EMPN0， 接 下 来 只 要 查询 B.ENAME 提取 出 每 个 管理 
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试 下 面 的 标量 子 查询 方案 


M 


上 述 标 量子 查 





ILLER 

















了 结果 集 里 ， de 


括 ? ”注意 ，NuLL 不 等 于 任何 值 ， 其 至 不 等 于 它 自身 。 在 
EMPNO 和 MGR 做 相等 连接 查询 (equi-join)， 
用 自 连接 方案 ， 又 希望 员工 KING 出 现在 最 终 的 结果 集 里 ， 





的 两 和 


法 。 这 两 种 解决 方案 的 结果 自然 是 相同 的 ， 我 们 把 输 


Fh 查询 那样 。 

















一 行 数据 除外 : 员工 KING 出 现在 


你 可 能 会 问 :“ 为 什么 不 会 包 
和 连接 解决 方案 中 ， 我 们 基于 








这 就 剔除 了 MCR 值 等 于 Null 的 员工 。 如 果 既 使 














就 必须 使 用 外 连接 ， 就 像 下 面 


第 一 种 解决 方案 使 用 了 ANSI 外 连接 ， 第 二 种 则 用 了 Oracle 的 外 连接 语 














出 结果 放 在 了 第 二 个 方案 的 后 面 。 
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/* ANSI */ 
select a.ename, b.ename mgr 
from emp a left join emp b 
on (a.mgr = b.empno) 


/* Oracle */ 

select a.ename, b.ename mgr 
from emp a, emp b 

where a.mgr = b.empno (+) 


ENAME MGR 

FORD JONES 
SCOTT JONES 
JAMES BLAKE 


TURNER BLAKE 
MARTIN BLAKE 


WARD BLAKE 
ALLEN BLAKE 
MILLER CLARK 
ADAMS SCOTT 
CLARK KING 
BLAKE KING 
JONES KING 
SMITH FORD 
KING 
` 
13.2 展现 祖 孙 关系 
1. 问题 


员工 CLARK 是 KING 的 下 属 ， 你 已 经 在 前 一 个 实例 里 学 到 了 如 何 展现 这 一 关系 。 那 么 ， 
如 果 员 工 CLARK 同时 也 是 另 一 个 员工 的 管理 者 的 话 ， 又 该 如 何 呢 ? 考虑 如 下 所 示 的 查询 。 
select ename,empno,mgr 


from emp 
where ename in ('KING','CLARK','MILLER') 











ENAME EMPNO MGR 
CLARK 7782 7839 
KING 7839 

MILLER 7934 7782 


如 上 所 示 ， 员 工 MILLER 是 CLARK 的 下 属 ， 而 CLARK 又 是 KING 的 下 属 。 你 希望 展现 
从 MILLER 到 KING 整个 层次 关系 。 你 希望 返回 如 下 所 示 的 结果 集 。 


LEAF — BRANCH. _ROOT 


MILLER- -»CLARK- - KING 


然而 ， 如 果 还 像 前 一 个 实例 那样 只 使 用 一 个 自 连 接 查 询 的 话 ， 其 实 无 法 显示 从 上 到 下 整个 
层次 关系 。 当 然 你 也 可 以 使 用 两 个 自 连 接 查 询 ， 但 你 真正 需要 的 可 能 是 能 够 遍历 整个 层次 





























关系 的 通用 做 法 。 
2. 解决 方案 


本 实例 不 同 于 前 一 个 实例 ， 正 如 标题 所 示 ， 现 在 我 们 面 对 的 是 一 个 3 层 的 层次 关系 。 有 
些 数据 库 没 有 提供 能 够 遍历 树 形 结构 数据 的 国 数 ， 我 们 可 以 采用 PostgreSQL 和 MySQL 
解决 方案 的 做 法 ， 但 必须 再 增加 一 个 自 连 接 查 询 。DB2、SQL Server 和 Oracle 为 展现 层 
次 关系 提供 了 专门 的 函数 。 因 此 ， 尽 管 自 连接 方案 仍然 适用 于 这 些 数据 库 ， 但 已 经 没有 





























必要 那么 做 了 。 

DB2 和 SQL Server 

使 用 WITH 递归 查询 找到 MILLER 的 管理 者 CLARK， 以 及 CLARK 的 
的 解决 方案 用 到 了 SQL Server 的 字符 串 连 接 操作 符 +, 





1 with x (tree,mgr,depth) 

2 as ( 

3 select cast(ename as varchar(100)), 
4 mgr, 0 

5 from emp 

6 where ename = 'MILLER' 

7 union all 

8 select cast(x.tree*'--»'«e.ename as varchar(100)), 
9 e.mgr, x.depth-41 

10 from emp e, x 

11 where x.mgr = e.empno 

12 ) 

13 select tree leaf — branch . root 
14 from x 

15 where depth = 2 








管理 者 KING, FI 














对 于 DB2 数据 库 ， 上 述 解决 方案 唯一 需要 修改 的 是 改 用 DB2 的 字符 
此 以 外 ， 该 解决 方案 完全 适用 于 DB2 和 SQL Server, 


Oracle 




















连接 操作 符 11。 除 


使 用 SYS_CONNECT_BY_PATH 函数 返回 MILLER, MILLER 的 管理 者 CLARK 和 CLARK 的 管 


理 者 KING。 使 用 CONNECT BY 子 句 遍历 树 形 结构 。 


1 select ltrim( 

2 sys_connect_by_path(ename,'-->'), 
3 '--»') leaf___branch___root 

4 from emp 

5 where level = 3 

6 start with ename = 'MILLER 

7 connect by prior mgr = empno 


PostgreSQL 和 MySQL 


基于 EMP 表 自 连接 两 次 返回 MILLER、MILLER 的 管理 者 CLARK 以 及 CLARK 的 管理 者 
KING。 下 面 的 解决 方案 使 用 了 PostgreSQL 的 双 紧 线 | | 字符 串 连 接 操作 符 。 











1 select a.ename||'-->'||b.ename 
2 ||'--»'[|c.ename as leaf___branch___root 
3 from emp a, emp b, emp c 





层次 查询 | 403 


4 where a.ename = 'MILLER' 
5 and a.mgr = b.empno 
6 and b.mgr = c.empno 


对 于 MySQL 用 户 ， 要 使 用 CONCAT 函数 ， 这 样 上 述 解 决 方案 就 可 以 像 PostgreSQL 一 样 正 
常 运行 了 。 

3. 讨论 

DB2 和 SQL Server 

本 解决 方案 的 做 法 是 从 叶子 节点 开始 遍历 到 根 节点 (你 不 妨 尝试 从 相反 的 方向 遍历 各 个 节 
点 ， 这 是 一 次 很 好 的 练习 )。UNION ALL 的 前 半 部 分 仅仅 找 出 了 员工 MILLER (叶子 节点 ) 
所 在 的 行 。UNION ALL 的 后 半 部 分 找到 了 MILLER 的 管理 者 ， 然 后 再 找到 那个 人 的 管理 者 ， 
这 种 找 出 “管理 者 的 管理 者 ”的 处 理会 一 直 重 复 ， 直 至 找到 最 高 级 别 的 管理 者 ( 根 节点 ) 
才 会 停 下 。pDEPTH 值 从 0 开始 ， 每 找到 一 层 管 理 者 就 自动 加 1。 当 执行 递归 查询 时 ，DB2 
会 为 我 们 维护 一 个 DEPTH 值 。 























Aa 


如 果 对 WITH 递归 查询 感 兴 趣 的 话 ， 请 参考 Jonathan Gennick 写 的 一 篇 有 趣 
有 深度 的 介绍 性 文章 “Understanding the WITH Clause", BA A http:// 


a . l . 
- gennick.com/database/understanding-the-with-clause, 





























接 下 来 ，UNION ALL 后 半 部 分 的 查询 把 递归 视图 X 连 接 到 EMP 表 ， 从 而 定义 父子 关系 。 下 面 
的 查询 语句 使 用 了 SQL Server 的 字符 串 连 接 操 作 符 。 


with x (tree,mgr,depth) 
as ( 
select cast(ename as varchar(100)), 
mgr, 0 
from emp 
where ename = 'MILLER' 
union all 
select cast(x.tree+'-->'+e.ename as varchar(100)), 
e.mgr, x.depth+1 
from emp e, x 
where x.mgr = e.empno 





) 

select tree leaf___branch___root 
from x 

TREE DEPTH 

MILLER 0 

CLARK 1 

KING 2 


现在 ， 最 重要 的 问题 已 经 解决 了 。 从 MILLER 开始 ， 我 们 找 出 了 从 下 到 上 的 整个 层次 关 
系 。 下 面 只 需要 格式 化 即 可 。 因 为 树 形 结构 的 遍历 是 递归 的 ， 只 要 把 EMP 表 的 当前 ENAME 
连接 到 它 前 面 的 一 个 名 字 即 可 ， 如 下 所 示 。 


with x (tree,mgr,depth) 
as ( 
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select cast(ename as varchar(100)), 
mgr，0 
from emp 
where ename = 'MILLER' 
union all 
select cast(x.tree*'--»'«e.ename as varchar(100)), 
e.mgr, x.depth+1 
from emp e, x 
where x.mgr = e.empno 
) 
select depth, tree 
from x 


DEPTH TREE 


0 MILLER 
1 MILLER- - CLARK 
2 MILLER- -»CLARK- ->KING 


最 后 ， 只 需要 保留 层次 结构 中 的 最 后 一 行 。 有 多 种 方法 可 以 实现 这 一 点 ， 但 本 解决 方案 
通过 DEPTH 来 判断 何 时 到 达 了 根 节 点 。( 显 然 ， 如 果 CLARK s KING, MA 
基于 DEPTH 的 过 滤 条 件 可 能 就 不 适用 。13.3 节 提 供 一 种 更 通用 的 方法 ， 它 不 需要 上 述 过 
WERE.) 


Oracle 

对 于 Oracle 解决 方案 而 言 ，CONNECT BY 子 句 完成 了 全 部 的 工作 。 从 MILLER 开始 ， 我 们 不 
需要 任何 连接 查询 就 能 一 直 凯 历 到 KING, CONNECT BY 子 句 里 的 表达 式 定义 了 数据 之 间 的 
关系 以 及 如 何 遍历 树 形 结构 。 


select ename 

from emp 

start with ename = 'MILLER' 
connect by prior mgr - empno 








MILLER 
CLARK 
KING 


关键 字 PRIOR 可 以 访问 层次 关系 中 前 一 条 记录 的 值 。 因 此 ， 对 于 任意 给 定 的 EMPNO， 可 以 
使 用 PRIOR MGR 去 获得 前 一 个 员工 的 管理 者 的 EMPN0。 对 于 本 实例 而 言 ， 当 看 到 CONNECT BY 
PRIOR MGR = EMPNO 这 样 的 子 句 时 ， 要 把 它 当 作 是 父 记 录 和 子 记录 之 间 的 连接 查询 。 


o 























更 多 关于 CONNECT BY 及 其 相关 功能 的 内 容 ， 请 参考 来 自 Oracle Technology 
“<. 


¿A 4. Network 的 文章 :“Querying Hierarchies:Top-of-the-Line Support”, 
oak 








现在 ， 已 经 成 功 地 显示 了 从 MILLER 到 KING 的 整个 层次 关系 。 大 部 分 问题 都 已 经 解决 
了 。 下 面 只 需 格式 化 即 可 。 使 用 SYS_CONNECT_BY_PATH 函数 把 所 有 ENAME 逐一 地 连接 起 来 。 
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select sys_connect_by_path(en 
from emp 
start with ename = 'MILLER' 
connect by prior mgr = empno 


- -»MILLER 
- -»MILLER- - CLARK 
- -»MILLER- - »CLARK- - KING 





ame,'--»') tree 


因为 只 希望 保留 完整 的 层次 关系 ， 我 们 可 以 通过 伪 列 LEVEL 过 滤 掉 不 需要 的 数据 (下 一 
实例 将 给 出 一 种 更 加 通用 的 解决 方案 )。 





select sys_connect_by_path(ena 
from emp 

where level = 3 

start with ename = 'MILLER' 

connect by prior mgr = empno 


-->MILLER-->CLARK-->KING 


me,'-->') tree 





最 后 ， 使 用 国 数 LTRIM 从 结果 集中 删除 最 前 面 的 - ->。 


PostgreSQL 和 MySQL 














因为 没有 层次 查询 相关 的 内 置 支持 ， 所 以 我 们 必须 自 连接 次 以 返回 整个 树 形 结构 。( 此 





处 的 n 代表 叶子 布点 和 根 市 点 之 间 





而 点 的 总 个 数 ， 包 括 根 市 点 自身 。 在 本 实例 中 ， 对 于 


MILLER ifj zi, CLARK 是 一 个 分 支 节点 (branch node), mi KING 则 是 根 节点 ， 因 此 从 
MILLER 到 KING 的 距离 是 两 个 节点 ，n=2。) 本 解决 方案 借用 了 前 一 个 实例 的 技巧 ， 只 是 


多 了 一 个 自 连 接 。 


select a.ename as leaf, 
b.ename as branch, 
c.ename as root 
from emp a, emp b, emp c 
where a.ename = 'MILLER' 
and a.mgr = b.empno 
and b.mgr = c.empno 


LEAF BRANCH ROOT 


MILLER CLARK KING 


下 一 步 也 是 最 后 一 步 ， 即 格式 化 





MySQL 则 使 用 CONCAT 函数 。 这 一 类 查询 的 缺点 是 ， 如 果 层 次 关系 发 生 了 变化 ， 例 如 ， 在 








输出 结果 ，PostgreSQL 使 用 || 字符 串 连 接 操作 符 ， 





CLARK 和 KING 之 间 多 了 一 个 节点 ， 我 们 就 得 再 增加 一 个 自 连 接 以 返回 整个 树 形 结构 。 











这 就 不 如 有 专门 的 内 置 函数 协助 处 开 


IEAA 局 历 的 数据 库 方便 。 





13.3 ”创建 层次 视图 


1. 问题 

















你 想 用 一 个 结 























结果 集 展示 一 个 表 的 全 部 数据 之 间 的 层次 关系 。 比 如 EMP 表 ， 员 工 KING 没有 


管理 者 ， 因 此 KING 是 根 节点 。 你 希望 展示 从 KING 开始 ， 所 有 KING 的 下 属 以 及 KING 
的 下 属 的 下 属 (如 果 有 的 话 )。 最 终 ， 你 希望 得 到 如 下 所 示 的 结果 集 。 














EMP_TREE 
KING 
KING - BLAKE 


KING - CLARK 
KING - CLARK - MILLER 
KING - JONES 


KING - JONES - FORD 
KING - JONES - FORD - SMITH 
KING - JONES - SCOTT 
KING - JONES - SCOTT - ADAMS 


2. 解决 方案 


DB2 和 SQL Server 

使 用 WITH 递归 查询 从 KING 开始 构造 层次 关系 ， 进 而 最 终 展现 出 所 有 员工 之 间 的 关系 。 下 
面 的 解决 方案 使 用 了 DB2 的 字符 串 连 接 操作 符 ||。SQL Server 用 户 则 需要 使 用 字符 串 连 
接 操 作 符 +。 除 了 字符 串 连 接 操作 符 的 不 同 ， 本 解决 方案 同时 适用 于 这 两 种 数据 库 。 











with x (ename,empno) 


1 
2 as 
3 select 
4 from 
5 where 
6 union 
7 select 
8 
9 from 
10 where 
11 ) 
12 select 
13 from 
14 order 
Oracle 


( 


cast(ename as varchar(100)),empno 

emp 

mgr is null 

all 

cast(x.ename||' - '||e.ename as varchar(109)), 
e.empno 

emp e, x 

e.mgr - x.empno 


ename as emp tree 
x 
by 1 





使 用 CONNECT BY 函数 定义 层次 关系 ， 接 着 使 用 SYS_CONNECT_BY_PATH 函数 格式 化 输出 结果 。 


1 select ltrim( 





sys_connect_by_path(ename,' - '), 
' - 7) emp tree 
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from emp 
start with mgr is null 
connect by prior empno=mgr 


4 
5 
6 
7 order by 1 








本 解决 方案 不 同 于 前 一 个 实例 ， 它 不 需要 基于 伪 列 LEVEL 的 过 滤 条 件 。 因 为 没有 该 过 滤 条 
件 ， 所 有 可 能 的 树 形 结构 都 会 被 显示 出 来 (此 处 PRIOR EMPNO=MGR ) 。 











PostgreSQL 

使 用 3 个 UNION 和 多 个 自 连接 。 
1 select emp tree 
2 from ( 
3 select ename as emp tree 
4 from emp 
5 where mgr is null 
6 union 
7 select a.ename||' - '||b.ename 
8 from emp a 
9 join 
10 emp b on (a.empno-b.mgr) 
11 where a.mgr is null 
12 union 
13 select rtrim(a.ename||' - '||b.ename 
14 IH - "[[c.ename,' - ') 
15 from emp a 
16 join 
17 emp b on (a.empno-b.mgr) 
18 left join 
19 emp c on (b.empno-c.mgr) 
20 where a.ename - 'KING' 
21 union 
22 select rtrim(a.ename||' - '||b.ename||' - “| 
23 c.ename||' - '||d.ename,' - ') 
24 from emp a 
25 join 
26 emp b on (a.empno-b.mgr) 
27 join 
28 emp c on (b.empno-c.mgr) 
29 left join 
30 emp d on (c.empnoz-d.mgr) 
31 where a.ename - 'KING' 
32 )x 


33 where tree is not null 
34 order by 1 


MySQL 
使 用 3 个 UNION 和 多 个 自 连 接 。 





1 select emp tree 

2 from ( 

3 select ename as emp tree 
4 from emp 

5 where mgr is null 

6 union 





7 select concat(a.ename,' - ',b.ename) 


8 from emp a 
9 join 


10 emp b on (a.empno-b.mgr) 


11 where a.mgr is null 
12 union 
13 select concat(a.ename,' 


1 
5 


14 b.ename,' - ',c.ename) 
15 from emp a 

16 join 

17 emp b on (a.empno=b.mgr) 

18 left join 

19 emp c on (b.empno=c.mgr) 

20 where a.ename = 'KING' 

21 union 

22 select concat(a.ename,' - ',b.ename,' - ', 
23 c.ename,' - ',d.ename) 
24 from emp a 

25 join 

26 emp b on (a.empno-b.mgr) 

27 join 

28 emp c on (b.empno-c.mgr) 

29 left join 

30 emp d on (c.empno-d.mgr) 

31 where a.ename - 'KING' 

32 )x 


33 where tree is not null 


34 order by 1 


3. 讨论 
DB2 和 SQL Server 





首先 识别 出 根 节 点 〈 员 工 KING) 所 在 的 行 ， 这 就 是 递归 视图 X 中 UNION ALL 的 前 半 部 分 。 























然后 找 出 KING A FE, ARTA 








的 下 属 (如 果 存 在 的 话 )， 这 一 步 需要 连接 递归 视图 x 








和 EMP 表 。 递 归 操 作 会 逐 层 遍历 全 体 员 工 。 递 归 视 图 X 返 回 的 结果 集 如 下 所 示 ， 此 时 尚未 


针对 输出 结果 做 格式 化 。 


with x (ename,empno) 
as ( 





select cast(ename as varchar(100)),empno 


from emp 
where mgr is null 
union all 


select cast(e.ename as varchar(100)),e.empno 


from emp e, x 
where e.mgr = x.empno 
select ename emp tree 
from x 


EMP. TREE 
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SCOTT 
ADAMS 
FORD 
SMITH 
BLAKE 
ALLEN 
WARD 
MARTIN 
TURNER 
JAMES 
CLARK 
MILLER 


层次 关系 中 的 全 部 ENAME 都 被 找 出 来 了 (这 一 点 很 有 用 )， 但 因为 没有 做 格式 化 ， 我 们 看 
不 出 哪些 是 管理 者 。 把 每 个 员工 和 他 的 管理 者 连接 起 来 ， 就 能 得 到 更 具 可 读 性 的 输出 结果 
了 。 下 面 的 表达 式 出 现在 递归 视图 X 里 UNION ALL 后 半 部 分 的 SELECT 子 句 中 ， 它 能 生成 所 

















需 格式 的 输出 结果 。 




















cast(x.ename+','+e.ename as varchar(100)) 


WITH 子 名 对 于 这 一 类 问题 非常 有 用 ， 
节点 ) 时 不 需要 修改 查询 。 


Oracle 


因为 层次 关系 发 生变 动 〈 例 如 ， 叶 子 节点 变 成 了 分 支 





CONNECT BY 子 名 返回 层次 结构 里 的 行 。START WITH 子 名 定义 根 节点 所 在 的 行 。 如 果 不 调 用 
SYS CONNECT BY PATH 函数 ， 我 们 会 看 到 所 需 的 各 行 数据 都 会 被 返回 (这 一 点 很 有 用 )， 但 
因为 还 没 做 格式 化 ， 因 而 无 法 展现 行 之 间 的 关系 。 





select ename emp_tree 

from emp 

start with mgr is null 
connect by prior empno = mgr 


EMP. TREE 

















MH 














通过 使 用 伪 列 LEVEL 和 函数 LPAD, ， 我 们 能 看 到 更 清晰 的 层次 关系 ， 最 终 我 们 也 会 更 深入 地 
晶 解 为 什么 SYs CONNECT. BY. PATH 能 够 返回 我 们 所 需 的 结果 集 。 











410 | 第 13 章 


select lpad('.',2*level,'.')||ename emp tree 
from emp 
start with mgr is null 

connect by prior empno = mgr 


EMP. TREE 











LA EX H £l RB AER Er EH T WE Er, fd PED UE E NEC R EL BU Ha ut 
里 去 。 例 如 ，KING 没有 上 级 管理 者 。JONES 的 管理 者 是 KING, SCOTT 的 管理 者 是 
JONES, ADAMS 的 管理 者 是 SCOTT。 














如 果 仔 细 观 察 SYS_CONNECT_BY_PATH 国 数 连 接 的 行 ， 我 们 就 会 明白 是 SYS_CONNECT_BY_PATH 
展现 出 了 层次 关系 。 有 了 SYS_CONNECT_BY_PATH， 每 当 到 达 一 个 新 节点 ， 我 们 同时 也 能 看 到 
它 的 所 有 父 节 点 。 

KING 

KING - JONES 


KING - JONES - SCOTT 
KING - JONES - SCOTT - ADAMS 








^» 


^] N 对 于 Oracle 8i 或 更 早 版 本 ， 不 妨 使 用 PostgreSQL 解决 方案 。 除 此 之 外 ， 因 
“. 

2 

' 





。 为 更 早 版 本 的 Oracle 其 实 已 经 支持 CONNECT BY 子 句 ， 只 要 使 用 LEVEL 和 
?' RPAD/LPAD 格式 化 输出 结果 即 可 。( 当 然 ， 模 仿 SYS | CONNECT. BY. PATH 的 输出 
格式 要 麻烦 一 些 。) 





PostgreSQL 和 MySQL 

PostgreSQL 和 MySQL 解决 方案 除了 SELECT 子 句 里 的 字符 串 连 接 操作 不 同 之 外 ， 甚 余 衣 
分 都 是 一 样 的 。 首 先 要 决定 一 个 分 支 里 最 多 会 有 多 少 个 节点 。 在 编写 查询 语句 之 前 ， 我 们 
必须 手动 完成 这 个 计算 。 仔 细 观 察 EMP 表 的 数据 ， 我 们 会 发 现 员 工 ADAM 和 SMITH 是 
层次 最 深 的 叶子 节点 。( 不 妨 参考 Oracle 解决 方案 的 “讨论 ”部 分 ， 那 里 面 已 经 用 很 美观 
的 格式 打印 出 了 EMP 表 的 层次 关系 。) 我 们 来 看 一 下 员工 ADAMS, ADAMS 的 管理 者 是 
SCOTT, SCOTT 的 管理 者 是 JONES， 而 JONES 的 管理 者 则 是 KING， 因 此 一 共 4 层 。 为 
了 展示 4 层 的 层次 关系 ， 我 们 必须 一 口气 做 3 次 EMP 表 的 自 连 接 查询 ， 并 且 必 须 写 一 个 
包含 有 4 个 部 分 的 UNION 查询 。 下 面 展 示 了 该 自 连 接 查 询 ( 即 本 解决 方案 中 最 下 面 那个 
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UNION 后 面 的 查询 ) 的 结果 。( 这 里 使 用 的 是 PostgreSQL 的 语法 ，MySQL 用 户 需要 把 字符 
串 连接 操作 符 || 改 为 CONCAT 函数 调用 。) 











select rtrim(a.ename||' - '||b.ename||' - “| 
c.ename||' - '||d.ename,' - ') as max depth 4 
from emp a 
join 
emp b on (a.empno-b.mgr) 
join 
emp c on (b.empno-c.mgr) 
left join 
emp d on (c.empnozd.mgr) 
where a.ename = 'KING' 
MAX, DEPTH 4 


KING - JONES - FORD - SMITH 
KING - JONES - SCOTT - ADAMS 
KING - BLAKE - TURNER 

KING - BLAKE - ALLEN 

KING - BLAKE - WARD 

KING - CLARK - MILLER 

KING - BLAKE - MARTIN 

KING - BLAKE - JAMES 


A.ENAME 过 滤 条 件 是 必须 的 ， 因 为 要 确保 根 节点 所 在 的 行 是 KING， 而 不 是 其 他 人 。 如 果 仔 
细 观 察 以 上 结果 集 ， 并 与 最 终结 果 集 相 比较 的 话 ， 我 们 会 发 现 某 些 3 层 关系 的 数据 没有 被 
打印 出 来 : KING-JONES-FORD 和 KING-JONES-SCOTT。 为 了 使 最 终结 果 集 包含 这 些 数据 ， 我 们 
需要 再 写 一 个 类 似 于 上 述 查 询 的 语句 ， 但 要 减少 一 个 自 连接 (做 2 次 自 连 接 而 不 是 3 次)。 
该 查询 的 结果 集 如 下 所 示 。 




















select rtrim(a.ename||' - '||b.ename 
Il' - "[[c.ename,' - ') as max depth 3 
from emp a 
join 
emp b on (a.empno-b.mgr) 
left join 
emp c on (b.empnoz-c.mgr) 
where a.ename - 'KING' 
MAX DEPTH 3 


KING - BLAKE - MARTIN 
KING - JONES - SCOTT 
KING - BLAKE - TURNER 
KING - BLAKE - JAMES 
KING - JONES - FORD 

KING - CLARK - MILLER 


像 前 一 个 查询 一 样 ， 上 述 A. ENAME 过 滤 条 件 也 是 必须 的 ， 因 为 要 确保 根 市 点 是 KING, f 
可 能 会 注意 到 这 两 个 查询 结果 中 会 有 一 些 重 辣 的 行 。 为 了 别 除 这 些 多 余 的 行 ， 只 要 把 两 个 














查询 UNION 起 来 即 可 。 


select rtrim(a.ename||' - '||b.ename 
||" - '"Ip[c.enane,' - ') as partial tree 
from emp a 
join 
emp b on (a.empno-b.mgr) 
left join 
emp c on (b.empno-c.mgr) 
where a.ename - 'KING' 
union 
select rtrim(a.ename||' - '||b.enanme[|' - '|| 
c.ename||' - '[[d.enanme,' - ') 
from emp a 
join 
emp b on (a.empno-b.mgr) 
join 
emp c on (b.empno-c.mgr) 
left join 
emp d on (c.empno-d.mgr) 
where a.ename - 'KING' 


PARTIAL TREE 


KING - BLAKE - MARTIN 

KING - BLAKE - TURNER 

KING - BLAKE - WARD 

KING - CLARK - MILLER 

KING - JONES - FORD 

KING - JONES - FORD - SMITH 
KING - JONES - SCOTT 

KING - JONES - SCOTT - ADAMS 


现在 ， 整 个 树 形 结构 已 经 基本 成 型 。 下 一 步 要 找 出 以 KING 为 根 市 点 的 、 两 层 关系 的 行 
(FH KING 的 直接 下 属 )。 返 回 这 些 行 的 查询 如 下 所 示 。 


select a.ename||' - '||b.ename as max depth 2 
from emp a 
join 
emp b on (a.empno-b.mgr) 
where a.mgr is null 














MAX. DEPTH 2 


KING - JONES 
KING - BLAKE 
KING - CLARK 


下 一 步 需 要 把 PARTIAL TREE 和 上 面 的 查询 UNION 起 来 。 


select a.ename||' - '||b.ename as partial tree 
from emp a 
join 
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emp b on (a.empno=b.mgr) 
where a.mgr is null 


union 
select rtrim(a.ename||' - '||b.ename 
l - "I[c.enane,' - ') 
from emp a 


join 


emp b on (a.empno-b.mgr) 
left join 
emp c on (b.empno-c.mgr) 


where a.ename = 'KING' 
union 
select rtrim(a.ename||' - '||b.ename[||' - '|| 
c.ename||' - '||d.ename,' - ') 
from emp a 
join 
emp b on (a.empno-b.mgr) 
join 
emp c on (b.empno-c.mgr) 
left join 
emp d on (c.empno-d.mgr) 
where a.ename = 'KING' 


PARTIAL TREE 


KING - BLAKE 
KING - BLAKE 
KING - BLAKE 
KING - BLAKE 
KING - BLAKE 
KING - BLAKE 
KING - CLARK 
KING - CLARK 
KING - JONES 
KING - JONES 
KING - JONES 
KING - JONES 
KING - JONES 


ALLEN 
JAMES 
MARTIN 
TURNER 
WARD 


MILLER 


FORD 
FORD - SMITH 
SCOTT 
SCOTT - ADAMS 


最 后 ， 把 KING 和 PARTIAL, TREE 也 UNION X 3e LJ E | c£ 


13.4” 找 出 给 定 的 父 


1. 问题 


你 想 找 出 JONES 的 下 属 员 工 ， 既 包括 直接 的 下 属 ， 
理 者 是 JONES 的 下 属 )。JONES 的 所 有 下 属 显示 如 下 。 























集中 。) 











结果 集 。 


节点 对 应 的 所 有 子 节 点 


也 包括 间接 的 下 属 ( 即 这 些 员工 的 管 




















(JONES 本 人 也 会 包含 在 该 结果 





ADAMS 
FORD 
SMITH 


2. 解决 方案 

能 够 自由 移动 到 树 形 结构 的 顶端 或 底 端 是 非常 有 用 的 一 项 特性 。 本 解决 方案 并 不 要 求 做 特 
殊 的 格式 化 工作 。 我 们 的 目标 只 是 要 显示 JONES 的 所 有 下 属 ， 也 包括 JONES 本 人 。 这 种 
类 型 的 查询 往往 能 体现 出 SQL 递归 特性 的 优势 ， 例 如 ，Oracle 的 CONNECT BY 子 句 ，SQL 
Server 和 DB2 的 WITH 子 句 。 





DB2 和 SQL Server 
使 用 WITH 递归 查询 找 出 JONES BJ F J, UNION 查询 的 前 半 部 分 ， 通 过 指定 WHERE ENAME = 
'JONES' 表明 递归 操作 从 JONES 开始 。 











1 with x (ename,empno) 
2 as ( 
3 select ename,empno 
4 from emp 
5 where ename = 'JONES' 
6 union all 
7 select e.ename, e.empno 
8 from emp e, x 
9 where x.empno = e.mgr 
10 ) 
11 select ename 
12 from x 

Oracle 


使 用 CONNECT BY 子 句 ， 并 指定 START WITH ENAME = 'JONES' 找 出 JONES 的 所 有 下 属 。 





1 select ename 

2 from emp 

3 start with ename = 'JONES' 
4 connect by prior empno = mgr 


PostgreSQL 和 MySQL 
我 们 必须 先 计 算出 树 形 结构 包含 了 多 少 个 节点 ， 下 面 的 查询 展示 了 如 何 确定 层次 关系 的 
深度 。 


/* 找到 JONES 的 EMPNO */ 
select ename,empno,mgr 








from emp 

where ename = 'JONES' 
ENAME EMPNO MGR 
JONES 7566 7839 


/* JONES 有 直接 下 属 吗 ? */ 
select count(*) 

from emp 

where mgr = 7566 








COUNT(*) 





/* JONES 有 两 个 直接 下 属 ,找到 他 们 的 EMPNO */ 
select ename,empno,mgr 

from emp 

where mgr = 7566 


ENAME EMPNO MOR 
SCOTT 7788 7566 
FORD 7902 7566 


/* SCOTT 和 FORD 有 下 属 吗 ? 
select count(*) 

from emp 

where mgr in (7788,7902) 





*/ 


COUNT (*) 





/* SCOTT 和 FORD 各 有 一 个 下 属 , 找 出 他 们 的 EMPNO * 
select ename ,empno ,mgr 
from emp 


where mgr in (7788,7902) 


ENAME EMPNO MGR 
SMITH 7369 7902 
ADAMS 7876 7788 


/* SMITH 和 ADAMS 有 下 属 吗 ? 
select count(*) 

from emp 

where mgr in (7369,7876) 





*/ 


COUNT(*) 


该 层次 关系 起 始 于 JONES, 终止 于 SMITH 和 AD 








/ 








AMS。 它 的 深度 为 3 层 。 既 然 已 经 知道 


了 深度 ， 我 们 就 可 以 从 顶端 到 底 端 依次 遍历 整个 层次 关系 。 


首先 ，2 次 自 连接 EMP K, AA Joi EA UH X + 





巴 2 行 3 列 的 数据 集 变 为 6 行 1 列 。( 对 


于 PostgreSQL 而 言 ， 还 有 另 一 种 做 法 ， 即 可 以 使 用 GENERATE SERIES(1,6) RRE REE 


视 表 T100, ) 


1 select distinct 
case t100.id 
when 1 then root 


2 
3 
4 when 2 then branch 





se 


12 w 


17 w 


除 此 之 外 ， 
如 下 所 示 。 


create 
as 
select 
from 
where 


create 
as 
select 
from 
where 


create 
as 
select 
from 
where 


else leaf 
end as JONES_SUBORDINATES 
from ( 
lect a.ename as root, 
b.ename as branch, 
c.ename as leaf 
from emp a, emp b, emp c 


here a.ename = 'JONES' 
and a.empno = b.mgr 
and b.empno = c.mgr 

) x, 

t100 


here t100.id <= 6 























我 们 还 可 以 使 用 视图 ， 并 把 视图 的 结果 集 UNION 起 来 。 我 们 创建 了 一 些 视图 














view vl 


ename ,mgr ,empno 
emp 
ename = 'JONES' 


View v2 

ename ,mgr ,empno 

emp 

mgr = (select empno from v1) 
view v3 

ename ,mgr , empno 


emp 
mgr in (select empno from v2) 


因而 ， 本 解决 方案 将 就 变 成 了 下 面 的 查询 。 


select 
union 
select 
union 
select 


3. 讨论 


ename from v1 


ename from v2 


ename from v3 


DB2 和 SQL Server 
WITH 递归 查询 使 得 本 问题 解决 起 来 容易 多 了 。NMNITH 子 句 的 第 一 部 分 ， 即 UNION ALL 的 前 


半 部 分 ， 返 回 了 员工 JONES 所 在 的 行 。 我 们 需要 返 








E| ENAME 以 得 到 员工 的 名 字 ， 并 返回 


EMPNO 以 便 基 于 它 做 连接 查询 。UNION ALL 的 后 半 部 分 基于 EMP.MGR H X. EMPNO 做 递归 的 连 
接 查 询 。 该 连接 条 件 将 一 次 次 地 执行 下 去 ， 直 至 遍历 完整 个 结果 集 。 


Oracle 





START WITH 子 句 表明 查询 操作 将 以 JONES 为 根 节点 。CONNECT BY 子 句 的 条 件 驱 动 树 形 结构 
的 遍历 操作 ， 并 将 一 直 执行 下 去 ， 直 到 条 件 不 再 成 立 才 会 停止。 
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PostgreSQL 和 MySQL 
这 里 用 到 的 技巧 来 自 13.2 节 。 本 解决 方案 最 显而易见 的 不 足 是 ， 我 们 需要 提前 知道 层次 关 
系 的 深度 。 


13.5 ”确认 叶子 万 点 、 分 支 世 点 和 根 节 点 


1. 问题 

你 想 确 定 给 定 的 一 行 数据 是 哪 种 类 型 的 市 点 :叶子 市 点 、 分 支 节 点 还 是 根 节 点 。 对 于 本 实 
例 而 言 ， 叶 子 节 点 代表 不 是 管理 者 的 员工 。 分 支 节 点 表示 管理 者 的 员工 ， 同 时 他 也 拥有 
自己 的 上 级 管理 者 。 根 节点 表示 没有 上 级 管理 者 的 员工 。 你 希望 通过 返回 1 (TRUE) 或 9 
(FALSE) 来 反映 每 一 行 在 层次 关系 中 的 状态 。 你 希望 返回 如 下 所 示 的 结果 集 。 




















ENAME IS_LEAF IS_BRANCH IS_ROOT 
KING 0 0 1 
JONES 0 1 0 
SCOTT 0 1 0 
FORD 0 1 0 
CLARK 0 1 0 
BLAKE 0 1 0 
ADAMS 1 0 0 
MILLER 1 0 0 
JAMES 1 0 0 
TURNER 1 0 0 
ALLEN 1 0 0 
WARD 1 0 0 
MARTIN 1 0 0 
SMITH 1 0 0 
2. 解决 方案 


EMP 表 是 树 形 结构 ， 而 不 是 递归 层次 结构 (recursive hierarchy) ， 因 为 根 节点 的 MGR 值 是 
NuLL。 认 识 到 这 一 点 很 重要 。 如 果 EMP 表 是 递归 层次 结构 ， 那 么 根 节 点 将 会 指向 自身 〈 即 
员工 KING 的 MGR 值 将 等 于 他 的 EMPN0)。 我 认为 这 是 违反 常理 的 ， 因 而 指定 根 节点 的 MGR 
值 为 Null, XT Oracle 的 CONNECT BY 子 句 和 DB2/SQL Server 的 WITH 子 句 而 言 ， 树 形 结 构 
处 理 起 来 更 容易 ， 甚 至 可 能 比 递归 层次 结构 的 处 理 效率 更 高 。 如 果 必 须要 处 理 递 归 层 次 结 
构 ， 并 且 要 使 用 CONNECT BY 或 WITH 子 句 ， 那 么 就 要 小 心 了 : 我 们 可 能 会 掉 进 死 循环 里 。 为 
防止 陷入 递归 层次 结构 设置 的 陷阱 ， 需 要 编写 额外 的 代码 小 心地 避 开 它 。 
DB2、PostgreSQL、MySQL 和 SQL Server 

使 用 3 个 标量 子 查询 ， 针 对 每 一 种 节点 类 型 分 别 计算 出 正确 的 “布尔 ” 值 (1 或 0)。 






























































1 select e.ename, 

2 (select sign(count(*)) from emp d 

3 where 0 = 

4 (select count(*) from emp f 

5 where f.mgr = e.empno)) as is_leaf, 
6 (select sign(count(*)) from emp d 

7 where d.mgr = e.empno 

8 and e.mgr is not null) as is_branch, 
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9 (select sign(count(*)) from emp d 
10 where d.empno = e.empno 

11 and d.mgr is null) as is root 
12 from emp e 


13 order by 4 desc,3 desc 


Oracle 


对 于 Oracle Database 10g 之 前 的 版 本 ， 上 述 标量 子 查询 方案 也 适用 。 下 面 的 解决 方案 利用 


























(Oracle Database 10g 新 增 的 ) 内 置 函数 来 帮助 我 们 识别 根 节 点 和 叶子 节点 。 这 些 函 数 分 别 





是 CONNECT_BY_ROOT 和 CONNECT_BY_ISLEAF。 


select ename, 
connect_by_isleaf is_leaf, 
(select count(*) from emp e 
where e.mgr = emp.empno 
and emp.mgr is not null 


decode(ename,connect by root(ename),1,0) is root 


from emp 

start with mgr is null 
connect by prior empno - mgr 
11 order by 4 desc, 3 desc 


1 
2 
3 
4 
5 
6 and rownum - 1) is branch, 
水 
8 
9 
0 


3. 讨论 
DB2, PostgreSQL, MySQL 和 SQL Server 


本 解决 方案 按照 “问题 ”部 分 提出 的 规则 确认 叶子 节点 、 分 支 节点 和 根 节 点 。 首 先 确认 一 


个 员工 是 否 是 叶子 节点 。 如 果 当 前 员工 不 是 管 到 
点 。 第 一 个 标量 子 查 询 IS_LEAF 如 下 所 示 。 


select e.ename, 
(select sign(count(*)) from emp d 
where 0 = 
(select count(*) from emp f 








E 者 (没有 下 属 )， 那 么 他 就 是 一 个 叶子 市 





where f.mgr = e.empno)) as is_leaf 


from emp e 
order by 2 desc 


TURNER 
MARTIN 
JAMES 
MILLER 
JONES 
BLAKE 
CLARK 
FORD 
SCOTT 
KING 


cOcococococcomnnnnmnnmnnmnpBnmnama 
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IS_LEAF 的 输出 结 s 60， 要 么 是 1， 因 此 要 对 COUNT(*) 查询 的 结果 调用 SIGN 函数 。 
否则 的 话 ， 对 于 叶子 节点 而 言 ， 我 们 将 得 到 14 而 不 是 1。 作 为 一 种 替代 方案 ， 因 为 只 希望 
返回 0 或 者 1， dos 以 对 一 个 只 有 一 行 数据 的 表 做 COUNT(*) 查询 。 例 如 : 


select e.ename, 
(select count(*) from t1 d 
where not exists 
(select null from emp f 
where f.mgr = e.empno)) as is, leaf 
from emp e 
order by 2 desc 

















TURNER 
MARTIN 
JAMES 
MILLER 
JONES 
BLAKE 
CLARK 
FORD 
SCOTT 
KING 


下 一 步 要 找 出 分 支 节点 。 如 果 一 个 员工 是 管理 者 《有 下 属 )， 并 且 他 们 也 碰巧 有 上 级 管理 
者 ， 那 么 该 员工 就 是 一 个 分 支 节 点 。 标 量子 查询 IS_BRANCH 的 结果 集 如 下 所 示 。 


select e.ename, 
(select sign(count(*)) from emp d 
where d.mgr = e.empno 
and e.mgr is not null) as is branch 
from emp e 
order by 2 desc 


cOoOcococcococmnbBmnbBmnbBmnbmnbmnbmnbau 












































ENAME IS BRANCH 


TURNER 
MILLER 
JAMES 
ADAMS 
KING 
ALLEN 
MARTIN 
WARD 


@ @ @ @ @ @ @ @ @ F F F F >= 








类 似 地 ， 有 必要 对 COUNT(*) 查询 的 结果 调用 SIGN 函数 。 否 则 ， 当 一 个 节点 是 分 支 节 点 时 ， 
我 们 有 可 能 得 到 比 1 大 的 值 。 就 像 标 量子 查询 IS_LEAF 一 样 ， 我 们 也 可 以 借助 一 个 只 有 
行 数据 的 表 来 避免 使 用 SION 函数 。 下 面 的 解决 方案 用 到 了 一 个 只 有 一 行 数据 的 表 T1。 


select e.ename, 

(select count(*) from t1 t 
where exists ( 
select null from emp f 
where f.mgr = e.empno 
and e.mgr is not null)) as is branch 
from emp e 
order by 2 desc 


























ENAME IS BRANCH 


SMITH 
TURNER 
MILLER 
JAMES 
ADAMS 
KING 
ALLEN 
MARTIN 
WARD 


最 后 要 找到 根 节 点 。 根 节点 的 员工 是 一 个 管理 者 ， 但 他 没有 上 级 管理 者 。 在 EMP 表 里 ， 只 
^H KING 是 根 节 点 。 标 量子 查询 IS ROOT 如 下 所 示 。 


select e.ename, 
(select sign(count(*)) from emp d 
where d.empno = e.empno 
and d.mgr is null) as is root 
from emp e 
order by 2 desc 


@ @ @ @ @ @ @ @ @ F. P. P. p. = 





























TURNER 
JAMES 
MILLER 
FORD 
ADAMS 
MARTIN 
BLAKE 


@ @ @ @ @ @ @ @ @ O O = 
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CLARK 0 
SCOTT 0 


EMP RRA 14 行 数据 ， 很 容易 就 能 看 出 来 KING 是 唯一 的 根 节点 ， 因 此 严格 地 说 ， 上 述 对 
COUNT(*) 查询 结果 调用 SIGN 函数 的 操作 并 不 是 必须 的 。 如 果 可 能 存在 多 个 根 节 点 ， 那 么 
就 有 必要 使 用 SIGN 函数 。 当 然 ， 也 可 以 像 前 面 的 IS BRANCH 和 IS LEAF 一 样 ， 借 助 一 个 只 
有 一 行 数据 的 表 来 避免 使 用 SIGN 函数 。 


Oracle 

对 于 Oracle Database 10g 之 前 的 版 本 ， 可 以 参考 其 他 数据 库 的 讨论 内 容 ， 它 们 的 解决 方案 
也 适用 于 Oracle (无 须 任 何 改动 )。 对 于 Oracle 10g 和 后 续 的 版 本 ， 我 们 可 以 利用 两 个 更 便 
于 识别 根 节点 和 叶子 节点 的 国 数 ， 它 们 分 别 是 CONNECT_BY_ROOT 和 CONNECT_BY_ISLEAF。 fE 
写作 本 书 时 ， 若 要 使 用 CONNECT_BY_ROOT 和 CONNECT. BY ISLEAF 国 数 ， 则 SQL 语句 中 也 要 
同时 用 到 CONNECT BY 子 句 。 首 先 ， 调 用 CONNECT_BY_ISLEAF 找 出 叶子 节点 ， 如 下 所 示 。 


select ename, 
connect by isleaf is, leaf 
from emp 
start with mgr is null 
connect by prior empno - mgr 
order by 2 desc 














ALLEN 
TURNER 
MARTIN 
WARD 
JAMES 
MILLER 
KING 
JONES 
BLAKE 
CLARK 
FORD 
SCOTT 


下 一 步 要 使 用 标量 子 查询 找 出 分 支 节 点 。 分 支 节 点 的 员工 既是 一 个 管理 者 ， 同 时 也 有 上 级 


管理 者 。 


select ename, 
(select count(*) from emp e 
where e.mgr - emp.empno 
and emp.mgr is not null 
and rownum = 1) is, branch 
from emp 
start with mgr is null 
connect by prior empno - mgr 
order by 2 desc 


cOcoccoccoccocconnmnnmnÓmumnmwmma 











ENAME IS_BRANCH 


MARTIN 
MILLER 
JAMES 
TURNER 
WARD 
ADAMS 
ALLEN 
SMITH 


-ExR ROWNUM EUER EAE RRI, AEA Y Wisa EE 150, mA Le 


最 后 ， 使 用 函数 CONNECT BY ROOT 识别 出 根 节 点 。 本 解决 方案 找 出 根 节 点 的 ENAME， 并 逐一 
地 比较 ENAME 和 下 面 查询 返回 的 行 数 据 。 如 果 两 个 ENAME 相等 ， 则 那 一 行 即 为 根 节 点 。 


select ename, 
decode(ename, connect by root(ename),1,0) is root 
from emp 
start with mgr is null 
connect by prior empno - mgr 
order by 2 desc 


@ @ @ @ @ @ @ @ @ F. P. B. p. = 




















TIT 





























MARTIN 
TURNER 
JAMES 
CLARK 
MILLER 


对 于 Oracle 9i 及 其 后 续 版 本 ， 也 可 以 使 用 SYS_CoNNECT_BY_PATH 函数 灰 代 CONNECT_BY_ROOT。 
Oracle 9i 版 本 的 解决 方案 如 下 所 示 。 


select ename, 
decode(substr(root,1,instr(root,',')-1),NULL,1,0) root 
from ( 
select ename, 
ltrim(sys_connect_by_path(ename,','),',') root 
from emp 


> 
下 
rz 
m 
= 
@ @ @ @ @ @ @ @ @ @ O O O = 
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start with mgr is null 
connect by prior empno-mgr 


WARD 
MARTIN 
TURNER 
JAMES 
CLARK 
MILLER 


> 
T= 
r= 
m 
= 
OOO @ @ @ @ @ @ @ @ @ O = 


SYS_CONNECT_BY_PATH 国 数 从 根 节点 开始 逐一 遍历 树 形 结构 ， 如 下 所 示 。 


select ename, 
ltrim(sys, connect by path(ename,', '), ',') path 
from emp 
start with mgr is null 
connect by prior empno-mgr 


ENAME PATH 

KING KING 

JONES KING, JONES 

SCOTT KING, JONES , SCOTT 
ADAMS KING, JONES , SCOTT , ADAMS 
FORD KING, JONES , FORD 

SMITH KING, JONES, FORD , SMITH 
BLAKE KING,BLAKE 

ALLEN KING,BLAKE,ALLEN 

WARD KING,BLAKE ,WARD 
MARTIN KING,BLAKE,MARTIN 
TURNER KING,BLAKE,TURNER 
JAMES KING,BLAKE , JAMES 
CLARK KING,CLARK 

MILLER KING,CLARK,MILLER 





为 了 得 到 根 节 点 ， 只 要 提取 出 PATH 里 第 一 个 ENAME 即 可 。 


select ename, 
substr(root,1,instr(root,', ')-1) root 
from ( 
select ename, 
ltrim(sys, connect by path(ename,', '), ',') root 
from emp 
start with mgr is null 





connect by prior empno=mgr 


) 

ENAME ROOT 
KING 

JONES KING 
SCOTT KING 
ADAMS KING 
FORD KING 
SMITH KING 
BLAKE KING 
ALLEN KING 
WARD KING 
MARTIN KING 
TURNER KING 
JAMES KING 
CLARK KING 
MILLER KING 


最 后 ， 标 出 ROOT 列 为 Null 的 行 ， 它 就 是 我 们 要 寻找 的 根 节 点 行 。 
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本 章 的 实例 之 所 以 没有 被 分 别 放 入 前 几 章 ， 不 仅 因为 相关 的 章节 太 长 了 ， 还 因为 这 些 问 题 
本 身 非 常 有 趣 。 虽 然 这 些 实例 的 实用 性 可 能 不 是 那么 强 ， 我 还 是 希望 把 本 章 的 内 容 写 得 尽 
量 有 趣 些 。 总 之 ， 我 觉得 这 些 实例 都 很 有 趣 ， 因 此 希望 把 它们 包含 进 本 书 。 


14.1 使 用 SQL Server 的 PIVOT 操 作 符 创 建交 又 
报表 
1. 问题 


你 想 创建 一 个 交叉 报表 ， 以 实现 把 行 形式 的 结果 集 转换 为 列 形式 。 你 已 经 掌握 了 传统 的 做 
法 ， 但 这 次 希望 尝试 一 些 不 同 的 技巧 。 尤 其 是 你 希望 不 使 用 CASE 表达 式 或 连接 操作 就 能 返 
回 如 下 所 示 的 结果 集 。 


DEPT 10 DEPT 20 DEPT 30 DEPT 40 



































2. 解决 方案 
使 用 PIVOT 操作 符 生 成 要 求 的 结果 集 ， 而 不 使 用 CASE 表达 式 或 额外 的 连接 操作 。 


1 select [10] as dept 10, 
2 [20] as dept 20, 
3 [30] as dept 30, 
4 [40] as dept 40 
5 from (select deptno, empno from emp) driver 
6 pivot ( 

7 count(driver.empno) 
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8 for driver.deptno in ( [10],[20],[30],[40] ) 
9 ) as empPivot 


3. 讨论 
最 初 看 到 PIVOT 操作 符 可 能 会 觉得 陌生 ， 其 实在 上 述 解决 方案 中 ， 它 执行 的 操作 在 技术 上 
等 价 于 我 们 所 熟知 的 形式 变换 查询 ， 如 下 所 示 。 


select sum(case deptno when 10 then 1 else 0 end) as dept 10, 
sum(case deptno when 20 then 1 else 0 end) as dept 20, 
sum(case deptno when 30 then 1 else 0 end) as dept 30, 
sum(case deptno when 40 then 1 else 0 end) as dept 40 

from emp 





DEPT 10 DEPT 20 DEPT 30 DEPT 40 


在 对 PIVOT 操作 有 了 基本 的 了 解 后 ， 现 在 我 们 把 它 拆 解 开 来 ， 看 看 它 究 竟 做 了 些 什 么 。 上 
述 解决 方案 中 的 第 5 行 展示 了 内 和 坐视 图 DRIVER, 

from (select deptno, empno from emp) driver 
我 选择 使 用 别名 driver, EAH ZIN Bx 4] [ 即 “ 表 表达 式 ”(table expression)] 中 的 数 
据 会 直接 流入 PIVOT 操作 。PIVOT 操作 符 通过 评估 第 8 行 的 FOR 列表 中 的 项 目 把 行 转换 为 
列 ， 如 下 所 示 。 

for driver.deptno in ( [10],[20],[30],[40] ) 
执行 过 程 大 致 如 下 。 
(1) 如 果 DEPTNO 等 于 10， 就 针对 相关 的 行 执行 预先 定义 好 的 聚合 操作 (COUNT(DRIVER.EMPNO) ) 。 
(2) 针对 DEPTN0 等 于 20、30 和 40 的 行 重复 同样 的 操作 。 
第 8 行 方 括号 里 的 项 目 不 仅 能 够 为 聚合 操作 提供 值 ， 同 时 ， 这 些 项 目 也 变 成 了 结果 集 里 的 
列 名 (不 带 方 括号 )。 上 述 解决 方案 的 SELECT 子 句 也 引用 了 Fon 列表 里 的 那些 项 目 ， 并 为 
它们 分 别 指定 了 别名 。 如 果 不 为 FOR 列表 里 的 项 目 指定 别名 ， 则 那些 项 目 就 会 变 成 列 名 ， 
但 是 会 去 掉 方 括号 。 
还 有 一 个 非常 有 趣 之 处 ， 由 于 DRIVER 只 是 一 个 普通 的 内 骨 视 图 ， 因 此 可 以 使 用 更 复杂 的 
SQL。 假 设 我 们 希望 修改 结果 集 ， 把 实际 的 部 门 名 称 作为 结果 集 的 列 名 。 下 面 列 出 了 DEPT 
表 的 数据 。 


select * from dept 







































































DEPTNO DNAME LOC 
10 ACCOUNTING NEW YORK 
20 RESEARCH DALLAS 
30 SALES CHICAGO 
40 OPERATIONS BOSTON 


我 们 希望 借助 PIVOT 返回 如 下 所 示 的 结果 集 。 

















ACCOUNTING RESEARCH SALES OPERATIONS 








INA [Z] DRIVER 事实 上 能 够 接受 任何 有 效 的 表 表 达 式 ， 因 此 可 以 先 把 EMP 表 和 DEPT 表 连 
接 起 来 ， 然 后 使 用 PIVOT 逐一 评估 其 查询 结果 。 下 面 的 查询 将 返回 上 述 要 求 的 结果 集 。 


select [ACCOUNTING] as ACCOUNTING, 
[SALES] as SALES, 
[RESEARCH] as RESEARCH, 
[OPERATIONS] as OPERATIONS 
from ( 


























select d.dname, e.empno 
from emp e,dept d 
where e.deptno=d.deptno 


) driver 
pivot ( 
count(driver.empno) 
for driver.dname in ([ACCOUNTING], [ SALES] , [RESEARCH] , [OPERATIONS]) 
) as empPivot 


如 上 所 述 ，PIVOT 提供 了 一 种 有 趣 的 转换 结果 集 的 办 法 。 如 果 你 以 前 习惯 使 用 传统 的 转换 
方法 ， 现 在 不 妨 将 其 作为 另 一 种 选择 放 入 你 的 工具 箱 。 


14.2 ”使 用 SQL Server 的 UNPIVOT 操 作 符 逆 向 转换 
交叉 报表 




















1. 问题 
你 有 一 个 格式 良好 的 结果 集 ， 即 “ 宽 表 ”(fat table) ， 你 想 针 对 该 结果 集 进行 逆向 转换 。 例 
如 ， 你 希望 把 1 行 4 列 的 结果 集 变 成 4 行 2 列 。 对 于 14.1 节 中 的 结果 集 : 


ACCOUNTING RESEARCH SALES OPERATIONS 























ACCOUNTING 3 

RESEARCH 5 

SALES 6 

OPERATIONS 0 

2. 解决 方案 

你 应 该 猜 到 SQL Server 除了 支持 PIVOT 外 ， 也 同时 支持 UNPIVOT。 为 了 实现 结果 的 逆向 转 
换 ， 只 要 把 前 一 个 实例 的 查询 作为 driver， 并 把 剩 下 的 工作 交 给 UNPIVoT 操作 符 即 可 。 我 
们 只 需要 指定 列 名 。 
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1 select DNAME, CNT 

2 from ( 

3 select [ACCOUNTING] as ACCOUNTING, 
4 [SALES] as SALES, 

5 [RESEARCH] as RESEARCH, 

6 [OPERATIONS] as OPERATIONS 
7 from ( 

8 select d.dname, e.empno 
9 from emp e,dept d 

10 where e.deptno=d.deptno 
11 

12 ) driver 

13 pivot ( 

14 count(driver.empno) 

15 for driver.dname in ([ACCOUNTING] , [SALES] , [RESEARCH] , [OPERATIONS]) 
16 ) as empPivot 


17 ) new driver 
18 unpivot (cnt for dname in (ACCOUNTING, SALES , RESEARCH, OPERATIONS) 
19 ) as un pivot 





EERE Bi PL Ze Dr] os i — ^ 9c 00, DS LAU Nit s| NEW. DRIVER 直接 使 用 了 前 一 个 实例 
的 代码 。( 如 果 你 不 理解 该 代码 ， 请 先 查 阅 前 一 个 实例 。) 由 于 你 已 经 理解 了 第 3 ~ 16 T 
的 代码 ， 唯 一 陌生 的 语法 就 是 第 18 行 的 UNPIVOT, 

UNPIVOT 命令 会 查看 来 自 NEW_DRIVER 的 结果 集 ， 并 评估 每 一 行 和 每 一 列 。 例 如 ，UNPIVOT f 
作 符 会 评估 NEW DRIVER 返回 的 列 名 。 如 果 等 于 ACCOUNTING， 就 把 列 名 ACCOUNTING 转换 为 
一 个 行 值 (放置 于 DNAME 列 )。 它 也 会 从 NEW. DRIVER 中 提取 出 ACCOUNTING 的 值 (该 值 等 于 
3)， 并 将 其 转换 为 ACCOUNTING 行 的 一 部 分 (放置 于 CNT 列 )。UNPIVOT 会 针对 FOR 列表 中 指 
定 的 每 个 项 目 执行 类 似 的 操作 ， 并 把 每 一 项 都 转换 为 一 行 记录 。 


新 的 结果 集 变 得 “ 窗 ” 了 许多 ， 只 有 DNAME 列 和 CNT 列 ， 并 且 有 4 行 数据 。 


select DNAME, CNT 




























































































from ( 
select [ACCOUNTING] as ACCOUNTING, 
[SALES] as SALES, 
[RESEARCH] as RESEARCH, 
[OPERATIONS] as OPERATIONS 
from ( 
select d.dname, e.empno 
from emp e,dept d 
where e.deptno=d.deptno 
) driver 
pivot ( 


count(driver.empno) 
for driver.dname in ( [ACCOUNTING], [SALES], [RESEARCH], [OPERATIONS] ) 
) as empPivot 
) new driver 
unpivot (cnt for dname in (ACCOUNTING, SALES , RESEARCH , OPERATIONS) 
) as un pivot 





ACCOUNTING 3 
RESEARCH 5 
SALES 6 
OPERATIONS 0 


14.3 ”使 用 Oracle 的 MODEL 子 名 变换 结果 集 


1. 问题 


就 像 本 章 第 一 个 实例 一 样 ， 你 希望 于 熟知 的 常规 变换 技巧 之 外 另辟蹊径 。 你 想 尝 试 一 下 
Oracle 的 MODEL 子 句 。 不 同 于 SQL Server 的 PIVOT 操作 符 ，Oracle 的 MODEL 子 句 并 不 是 用 





来 做 结果 集 变换 的 。 说 得 准确 一 些 ， 用 MODEL 子 句 做 结果 集 变换 





实 算是 误 用 ， 它 并 不 符 








A MODEL 子 句 的 设计 意图 。 尽 管 如 此 ，MODEL 子 句 还 是 为 常见 问题 提供 了 一 种 有 趣 的 思路 。 























对 于 本 例 而 言 ， 你 希望 把 下 面 的 结果 集 : 


select deptno, count(*) cnt 
from emp 
group by deptno 


DEPTNO CNT 
10 3 
20 5 
30 6 
做 如 下 转换 。 
D10 D20 D30 
3 5 6 
2. 解决 方案 





和 常规 的 变换 技巧 一 样 ， 要 在 MODEL 子 句 中 使 用 聚合 和 CASE 表达 式 。 不 同 之 处 在 于 我 们 使 





用 数组 来 存储 聚合 运算 的 值 ， 并 返回 结果 集 里 的 数组 。 


select max(d10) d10, 
max(d20) d20, 
max(d30) d30 
from ( 
select d10,d20,d30 





from ( select deptno, count(*) cnt from emp group by deptno ) 


model 
dimension by(deptno d) 
measures(deptno, cnt d10, cnt d20, cnt d30) 
rules( 
diO[any] 


case when deptno[cv()]-10 then di0[cv()] else 0 end, 


d20[any] = case when deptno[cv()]-20 then d20[cv()] else 0 end, 


d30[any] 


case when deptno[cv()]230 then d30[cv()] else 0 end 





3. 讨论 

功能 强大 的 MODEL 子 句 是 对 Oracle SQL 工具 箱 非 常 有 益 的 补充 。 一 旦 开始 使 用 MODEL， 我 
们 一 定 会 被 它 提供 的 各 种 实用 的 功能 吸引 住 。 比 如 进 代 ， 以 数组 形式 访问 行 值 ， 向 结果 集 
upsert' 行 值 的 能 力 ， 以 及 构建 参考 模型 的 能 力 。 虽 然 本 实例 不 会 用 到 MODEL 子 句 的 这 些 非 
常 酷 的 功能 ， 但 (出 于 学 习 和 研究 的 目的 ) 从 多 种 角度 审视 问题 ， 并 以 出 人 意料 的 方式 使 
用 某 些 功 能 未 党 不 是 一 次 有 益 的 尝试 。 
理解 本 解决 方案 的 第 一 步 是 ， 仔 细 观 察 FROM FARE. TAPA: 
中 每 个 DEPTNO 对 应 的 员工 总 数 。 结 果 集 显示 如 下 。 

select deptno, count(*) cnt 


from emp 
group by deptno 





















































图 用 于 统计 EMP 表 


em 























DEPTNO CNT 
10 3 
20 5 
30 6 

















以 上 结果 集 就 是 MODEL 要 处 理 的 数据 。 仔 细 观 察 MODEL 子 句 ， 可 以 发 现 它 有 3 个 组 成 部 分 : 
DIMENSION BY, MEASURES 和 RULES。 先 从 MEASURES 开始 。 


MEASURES 列表 的 项 目 就 是 我 们 为 该 查询 声明 的 数组 。 该 查询 使 用 了 4 个 数组 : DEPTNO, 
D10, D20 和 D30。 与 SELECT 列表 类 似 ，NMEASURES 列表 里 的 数组 也 可 以 指定 别名 。 不 难 发 
现 ， 上 述 4 个 数组 中 有 3 个 实际 上 都 来 产 于 内 秽 视图 的 CNT, 


如 果 说 MEASURES 列表 包含 了 我 们 用 到 的 数组 ， 那 么 DIMENSION BY 子 句 包含 的 项 目 则 是 数 
组 的 索引 。 试 想 一 下 ， 数 组 D19 只 是 CNT 的 别名 。 再 看 一 下 上 述 内 符 视 图 的 结果 集 ， 我 们 
会 发 现 CNT 有 3 个 值 : 3、5 和 6。 当 基于 cNT 值 创建 一 个 数组 时 ， 我 们 创建 的 是 拥有 3 个 
元 素 的 数组 ， 即 3 个 整数 值 : 3、5 和 6。 现在， 我 们 该 如 何 逐 一 地 访问 该 数组 的 值 呢 ? 需 
要 借助 数组 索引 。 由 DIMENSION BY 子 名 定义 的 索引 值 如 下 : 10、20 和 30 (来 自 上 述 结果 
集 )。 因 此 ， 以 下 面 的 表达 式 为 例 。 


d10[10] 
该 表达 式 的 评估 结果 为 3， 该 值 就 是 数组 D10 中 DEPTNO 10 对 应 的 CNT [Ë (该 值 为 3)。 


3 个 数组 (D10, D20. D30) 都 是 基于 CNT 值 创 建 的 ， 因 此 它们 都 有 相同 的 值 。 那 么 ， 如 何 
把 合适 的 统计 值 放 入 到 正确 的 数组 中 呢 ? 这 是 RULES 子 句 要 做 的 事 。 如 果 仔 细 观 察 上 述 内 
艇 视图 的 结果 集 的 话 ， 我 们 会 看 到 DEPTO 的 值 分 别 为 10、20 和 30, RULES 子 句 里 的 CASE 
表达 式 只 要 逐一 评估 DEPTNO 数组 的 每 个 值 即 可 。 

° 如 果 值 为 10， 为 D10[10] 存 入 DEPTNO 10 对 应 的 CNT 值 ， 否 则 存 入 0。 


° 如 果 值 为 20， 为 D20[20] FA DEPTNO 20 对 应 的 CNT 值 ， 否 则 存 入 0。 
° 如 果 值 为 30， 为 036[36] 存 入 DEPTNO 30 对 应 的 CNT 值 ， 否 则 存 入 0。 
































































































































注 1:“upsert” 的 原意 是 “如 果 表 中 已 经 存在 相关 记录 ， 则 执行 UPDATE 操作 ， 和 否则， 执行 INSERT 操作 ”， 
但 此 处 指 的 是 对 中 间 查 询 结 果 进 行 修改 的 操作 ， 而 不 是 针对 物理 上 存在 的 表 。 一 一 译 者 注 
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如 果 你 感到 迷惑 不 解 ， 请 不 要 担心 。 我 们 接 下 来 不 妨 先 执行 一 下 到 目前 为 止 讨 论 过 的 查询 
代码 ， 下 面 是 刚刚 讨论 过 的 查询 代码 对 应 的 结果 集 。 有 时 候 读 一 段 文字 内 容 ， 然 后 实际 执 
行 一 下 对 应 的 代码 ， 最 后 再 回 过 头 去 重新 读 一 遍 文 字 内 容 ， 这 样 理解 起 来 会 更 容易 。 实 际 
执行 一 下 下 面 的 代码 之 后 ， 相 信 你 就 能 迅速 理解 到 目前 为 止 我 们 讲 过 的 内 容 。 

select deptno, d10,d20,d30 

from ( select deptno, count(*) cnt from emp group by deptno ) 

model 


dimension by(deptno d) 
measures(deptno, cnt d10, cnt d20, cnt d30) 






































rules( 
d10[any] = case when deptno[cv()]=10 then d10[cv()] else 0 end, 
d20[any] = case when deptno[cv()]=20 then d20[cv()] else 0 end, 
d30[any] = case when deptno[cv()]=30 then d30[cv()] else 0 end 

) 

DEPTNO D10 D20 D30 

10 3 0 0 
20 0 5 0 
30 0 0 6 


如 上 所 示 ， 正 是 RULES 子 句 改变 了 每 一 个 数组 里 的 值 。 如 果 你 仍然 感到 疑惑 不 解 ， 不 妨 实 
际 执 行 一 下 如 下 所 示 的 查询 语句 ， 该 查询 注释 掉 了 RULES 子 句 里 的 表达 式 ， 其 他 部 分 与 上 
述 查询 相同 。 


select deptno, d10,d20,d30 
from ( select deptno, count(*) cnt from emp group by deptno ) 
model 
dimension by(deptno d) 
measures(deptno, cnt d10, cnt d20, cnt d30) 
rules( 
/* 
d10[any] = case when deptno[cv()]=10 then d10[cv()] else 0 end, 
d20[any] = case when deptno[cv()]=20 then d20[cv()] else 0 end, 











d30[any] = case when deptno[cv()]=30 then d30[cv()] else 0 end 
*/ 
) 
DEPTNO D10 D20 D30 
10 3 3 3 
20 5 5 5 
30 6 6 6 











现在 应 该 足够 清楚 明白 了 ， 上 述 MODEL 子 句 的 结果 集 和 内 艇 视图 完全 相同 ， 只 是 COUNT ER 
数 的 返回 值 被 分 别 指定 了 别名 D19、D29 和 D30。 如 下 所 示 的 查询 也 能 证 明 这 一 点 。 
select deptno, count(*) d10, count(*) d20, count(*) d30 


from emp 
group by deptno 














DEPTNO D10 D20 D30 


10 3 3 3 
20 5 5 5 
30 6 6 6 


EIJE, MODEL 子 句 所 做 的 事情 就 是 取出 DEPTNO 和 CNT 的 值 ， 把 它们 放 入 数组 ， 并 确保 每 
一 个 数组 代表 一 个 单独 的 DEPTNO。 现 在 ， 每 一 个 数组 D10、D29 和 D30 都 含有 一 个 非 零 
值 ， 它 们 代表 给 定 DEPTNO 对 应 的 CNT。 结 果 集 变换 已 经 完成 ， 剩 下 的 就 是 调用 聚合 函数 
MAX 以 返回 单独 的 一 行 结果 。( 本 书 前 几 章 已 经 多 次 使 用 MIN 或 SUM， 本 实例 的 做 法 也 出 
于 同样 的 目的 。) 


select max(d10) d10, 
max(d20) d20, 
max(d30) d30 
from ( 
select d10,d20,d30 
from ( select deptno, count(*) cnt from emp group by deptno ) 
model 
dimension by(deptno d) 
measures(deptno, cnt d10, cnt d20, cnt d30) 
rules( 
d10[any] = case when deptno[cv()]=10 then d10[cv()] else 0 end, 
d20[any] = case when deptno[cv()]=20 then d20[cv()] else 0 end, 











d30[any] = case when deptno[cv()]=30 then d30[cv()] else 0 end 
) 
) 
D10 D20 D30 
bs de. c^ ^ M 
14.4 ”从 不 固定 位 置 提取 字符 串 的 元 素 
1. 问题 














你 有 一 个 字符 串 ， 其 中 包含 一 段 连续 的 日 志 数 据 。 你 想 解 析 该 字符 串 ， 并 从 中 提取 出 部 分 
信息 。 不 过 ， 你 需要 的 信息 并 不 存在 于 字符 串 的 固定 位 置 。 因 此 ， 你 必须 借助 目标 信息 附 
近 的 某 些 字符 来 定位 并 提取 所 需 的 内 容 。 例 如 ， 考 虑 下 面 的 字符 


xxxxxabc[867 ]xxx[ - ]xxxx[5309 ]xxxxx 


xxxxxtime:[11271978]favnum: [4]id: [Joe] xxxxx 
call:[F. GET ROWS( )]bi:[ROSEWOOD. . .SIR]b2: [44400002 ]77 . 90xxxxx 
film:[non marked]qq: [unit]tailpipe:[withabanana? ]80sxxxxx 


尔 希 望 提 取出 方 括 号 内 的 值 ， 返 回 如 下 所 示 的 结果 集 。 
































H 





o 




















Isl 




















FIRST VAL SECOND VAL LAST VAL 

867 - 5309 
11271978 4 Joe 

F GET ROWS( ) ROSEWOOD...SIR 44400002 

non marked unit withabanana? 





2. 解决 方案 

尽管 不 知道 我 们 所 感 兴趣 的 字符 的 确切 位 置 ， 但 我 们 确定 它们 是 被 包含 在 方 括号 “[]” 中 
的 ， 并 且 知 道 有 3 组 这 样 的 值 。 使 用 Oracle 的 内 置 函数 INSTR 找 出 方 括号 的 位 置 。 使 用 内 
置 函数 SUBSTR 从 字符 串 中 提取 所 需要 的 值 。 视 图 V 中 包含 了 我 们 要 解析 的 字符 串 ， 它 的 定 
义 如 下 所 示 。( 它 的 存在 只 是 为 了 增强 代码 的 可 读 性 。) 


create view V 






































as 

select 'xxxxxabc[867]xxx[-]xxxx[5309]xxxxx' msg 
from dual 

union all 

select 'xxxxxtime:[11271978]favnum:[4]id:[Joe]xxxxx' msg 
from dual 

union all 

select 'call:[F GET. ROWS() ]b1: [ROSEWOOD. . .SIR]b2:[44400002]77.90xxxxx' msg 
from dual 

union all 

select 'film:[non marked]qq: [unit]tailpipe: [withabanana?]80sxxxxx' msg 
from dual 

1 select substr(msg, 

2 instr(msg,'[',1,1)41, 

3 instr(msg,']',1,1)-instr(msg,'[',1,1)-1) first val, 

4 substr(msg, 

5 instr(msg,'[',1,2)41, 

6 instr(msg,']',1,2)-instr(msg,'[',1,2)-1) second val, 

7 substr(msg, 

8 instr(msg,'[',-1,1)41, 

9 instr(msg,')',-1,1)-instr(msg,'[',-1,1]-1) last val 

10 from V 

3. 讨论 


有 了 Oracle 的 内 置 函数 INSTR， 很 容易 就 能 解决 本 问题 。 由 于 已 经 知道 我 们 感 兴趣 的 值 被 
“[]” 包 围 ， 并 且 有 3 组 “[]”， 那 么 ， 本 解决 方案 的 第 一 步 就 是 要 使 用 INSTR 在 每 个 字符 
串 中 找 出 “[]” 的 位 置 。 下 面 的 例子 返回 了 每 一 行 中 3 个 左 方 括号 和 3 个 右 方 括 号 的 确切 
位 置 。 
select instr(msg, '[',1,1) “1st_[“, 
instr(msg,']',1,1) *] 1st", 
instr(msg,'[',1,2) "2nd [^, 
instr(msg,']',1,2) *] 2nd", 
instr(msg,' [',-1,1) "3rd [^, 
instr(msg,')',-1,1) *] 3rd" 





from V 
1st [ ] 1st 2nd [ ] 2nd 3rd [ ] 3rd 
9 13 17 19 24 29 
11 20 28 30 34 38 
6 19 23 38 42 51 
6 17 21 26 36 49 





现在 ， 最 困难 的 工作 已 经 完成 了 。 剩 下 的 只 需要 把 方 括号 的 位 置 插入 到 SUBSTR 以 实现 MSG 





的 解析 即 可 。 你 可 能 已 经 注意 到 上 述 完 整 的 解决 方案 里 有 一 些 针对 
数学 运算 ， 例 如 : +1 和 -1; 这 是 为 了 确保 左 方 括号 [ 不 会 被 返回 














F INSTR 返回 值 的 简单 的 





。 相 较 于 完整 的 解决 方 


案 ， 下 面 给 出 的 查询 语句 不 包括 这 些 +1 和 -1 的 操作 。 注 意 ， 每 一 个 返回 值 开头 的 字符 都 


是 左 方 括号 。 


select substr(msg, 


instr(msg, '[ 
instr(msg, '] 


!,1,1], 
',1,1)-instr(msg, '[',1,1]) first val, 


substr(msg, 


instr(msg, '[ 
instr(msg,']' 


' 1,2], 
,1,2)-instr(msg,'[',1,2]) second val, 


substr(msg, 
instr(msg,'[',-1,1], 
instr(msg,']',-1,1)-instr(msg, [',-1,1]) last val 


from V 


FIRST VAL 
[867 
[11271978 

[F. GET. ROWS() 
[non marked 





SECOND VAL LAST VAL 

[- [5309 

[4 [Joe 
[ROSEWOOD...SIR [44400002 
[unit [withabanana? 





从 以 上 结果 集中 可 以 看 到 ， 左 方 括号 也 被 返回 了 。 你 可 能 会 想 : 


加 上 1， 这 样 就 去 掉 了 左 方 括号 。 为 什么 要 减 去 1 呢 ? ” 因 





去 ， 而 不 添加 减 1 操作 的 话 ， 右 方 括号 就 会 被 返回 ， 如 下 所 示 。 


select substr(msg, 


instr(msg, '[ 
instr(msg,']' 





!,1,1]41, 
;1,1)-instr(msg, '[',1,1)) first val, 


substr(msg, 


instr(msg, '[ 
instr(msg, '] 


!,1,2]41, 
',1,2)-instr(msg, '[',1,2)) second val, 


substr(msg, 
instr(msg,'[',-1,1]41, 
instr(msg,')',-1,1)-instr(msg, [',-1,1]) last val 


from V 


FIRST VAL 
867] 
11271978] 

F GET ROWS()] 
non marked] 


SECOND VAL LAST VAL 

] 5309] 
4] Joe] 
ROSEWOOD...SIR] 44400002] 
unit] withabanana?] 





现在 应 该 很 清楚 了 ， 为 了 确保 不 返回 





引 结 束 的 位 置 减 去 1。 





“好 吧 ， 为 INSTR 的 返回 值 
为 如 果 我 们 把 加 1 的 操作 放 回 

















方 括号 ， 我 们 必须 在 索引 开始 的 位 置 加 上 1， 并 在 索 





14.5 ”计算 一 年 有 多 少 天 


1. 问题 
计算 一 年 有 多 少 天 。 





本 实例 为 9.2 节 补 充 了 新 的 解法 ， 该 解决 方案 只 适用 于 Oracle, 








2. 解决 方案 
使 用 TO. CHAR 函数 把 一 年 的 最 后 一 天 格式 化 为 用 3 位 数字 表示 的 日 期 序号 


select 'Days in 2005: '|| 
to char(add, months(trunc(sysdate, 'y'),12)-1, 'DDD') 
as report 
from dual 
union all 
select 'Days in 2004: '|| 
to char(add, months(trunc( 
to date('01-SEP-2004'), 'y'),12)-1, 'DDD') 


w"w0-0U À Q N P. 


from dual 


Days in 2005: 365 
Days in 2004: 366 


3. 讨论 
首先 调用 TRUNC 函数 返回 给 定 日 期 所 届 年 份 的 第 一 天 ， 如 下 所 示 。 


select trunc(to_date('01-SEP-2004'),'y') 
from dual 





TRUNC(TO DA 


01-JAN-2004 


o 














下 一 步 ， 调 用 ADD_MONTHS 为 截取 的 日 期 值 加 上 一 年 (12 个 月 )。 然 后 , B 
最 初 的 给 定 日 期 所 属 年 份 的 最 后 一 天 。 


select add_months( 
trunc(to_date('01-SEP-2004'),'y'), 
12) before_subtraction, 
add_months( 
trunc(to_date('01-SEP-2004'),'y'), 
12)-1 after_subtraction 
from dual 








BEFORE_SUBT AFTER_SUBTR 


减 去 


天 ， 得 到 








现在 已 经 得 到 了 目标 年 份 的 最 后 一 天 ， 接 下 来 只 要 调用 TO CHAR 返回 一 个 3 位 数字 即 可 ， 
该 数字 表示 最 后 一 天 在 这 一 年 中 的 日 期 序号 (第 1 天、 第 50 天， 等 等 )。 
select to_char( 
add_months( 


trunc(to_date('01-SEP-2004'),'y'), 
12)-1,'DDD') num days, in 2004 








from dual 
14.6 ”查找 含有 数字 和 字母 的 字符 串 
1. 问题 





你 有 一 列 含 有 数字 和 字母 的 字符 串 数据 ， 并 且 和 希望 返回 那些 既 有 字母 又 有 数字 的 行 。 换 名 
话说 ， 如 果 一 个 字符 串 只 含有 数字 或 只 含有 字母 ， 则 不 返回 。 返 回 值 应 该 既 包 含 字母 义 包 
含 数字 ， 考 虑 如 下 所 示 的 数据 。 


STRINGS 

1010 switch 
333 
3453430278 
ClassSummary 
findRow 55 
threes 


最 终 的 结果 集 应 该 只 有 那些 既 含 有 字母 又 含有 数字 的 行 。 
STRINGS 




















1010 switch 
findRow 55 


2. 解决 方案 

使 用 内 置 函 数 TRANSLATE 把 每 一 个 字母 或 数字 转换 成 指定 的 特殊 字符 ， 然 后 只 保留 那些 
每 种 特殊 字符 至 少 都 出 现 过 一 次 的 字符 串 。 本 解决 方案 使 用 了 Oracle 句法 ， 但 DB2 和 
PostgreSQL 也 都 支持 TRANSLATE， 因 此 你 能 够 很 容易 地 对 本 解决 方案 做 出 适当 改动 以 适用 
于 另 一 个 数据 库 。 


with v as ( 
select 'ClassSummary' strings from dual union 











select '3453430278' from dual union 
select 'findRow 55' from dual union 
select '1010 switch' from dual union 
select '333' from dual union 
select 'threes' from dual 

) 


select strings 





from ( 
select strings, 
translate( 
strings, 
'abcdefghijklmnopqrstuvwxyz0123456789', 
rpad('#',26,'#')||rpad('*',10,'*')) translated 
from v 
) x 
where instr(translated,'#') > 0 
and instr(translated,'*') > 0 




















FR] 
x 
mt 
o 
e» 
X 
em 
FR] 











如 果 不 想 使 用 WITH FA, HaT AEA AKAN 





3. 讨论 
有 了 TRANSLATE 函数 ， 本 问题 的 解决 就 非常 简单 了 。 首 先 借助 TRANSLATE 把 所 有 字母 和 数 
字 分 别 替换 为 # 和 *， 中 间 结 果 AARIA X) 显示 如 下 。 


with v as ( 
select 'ClassSummary' strings from dual union 











select '3453430278' from dual union 
select 'findRow 55' from dual union 
select '1010 switch' from dual union 
select '333' from dual union 
select 'threes' from dual 
) 
select strings, 

translate( 

strings, 


'abcdefghijklmnopqrstuvwxyz0123456789' , 
rpad('£',26,'s')||rpad('*',10,'*')) translated 
from v 


STRINGS TRANSLATED 


1010 switch  **** JHHHHH 
333 *** 
3453430278 kkkkkkkkkk 
ClassSummary C####5S###### 
findRow 55  ####R## ** 
threes #HHHt# 


现在 ， 只 剩 下 了 一 个 问题 ， 就 是 只 保留 那些 # 和 * 都 至 少 出 现 过 一 次 的 行 。 使 用 函数 
INSTR 判断 一 个 字符 串 中 是 否 包含 # 和 *。 如 果 两 种 字符 都 出 现 过 ， 那 么 返回 值 将 大 于 0。 
为 了 让 你 看 得 更 加 清楚 明白 ， 下 面 列 出 了 最 终 返 回 的 字符 串 和 转换 后 的 值 。 


with v as ( 
select 'ClassSummary' strings from dual union 
































select '3453430278' from dual union 
select 'findRow 55' from dual union 
select '1010 switch' from dual union 
select '333' from dual union 
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select 'threes' from dual 
) 
select strings, translated 
from ( 
select strings, 
translate( 
strings, 
'abcdefghijklmnopqrstuvwxyz0123456789', 
rpad('$',26,'s')||rpad('*',10,'*')) translated 
from v 


where instr(translated, 's') 


> 0 
and instr(translated,'*') > 0 


STRINGS TRANSLATED 


1010 switch **** #HHHhh 
findRow 55 ####R## ** 


14.7 ”在 Oracle 中 把 整数 转换 成 二 进 制 


1. 问题 
在 Oracle 数据 库 中 ， 你 想 把 一 个 整数 转换 为 二 进 制 形式 。 例 如 ， 你 希望 返回 EMP 表 里 的 所 
有 工资 ， 以 二 进 制 形式 显示 的 工资 也 要 作为 结果 集 的 一 部 分 被 返回 ， 如 下 所 示 。 























ENAME SAL SAL_BINARY 
SMITH 800 1100100000 
ALLEN 1600 11001000000 
WARD 1250 10011100010 
JONES 2975 101110011111 
MARTIN 1250 10011100010 
BLAKE 2850 101100100010 
CLARK 2450 100110010010 
SCOTT 3000 101110111000 
KING 5000 1001110001000 
TURNER 1500 10111011100 
ADAMS 1100 10001001100 
JAMES 950 1110110110 
FORD 3000 101110111000 
MILLER 1300 10100010100 
2. 解决 方案 














本 解决 方案 会 用 到 MODEL 子 句 ， 因 此 需要 运行 在 Oracle Database 10g 或 更 新 的 版 本 上 。 
MODEL 具有 迭代 和 以 数组 形式 访问 行 值 的 能 力 ， 选 择 它 来 解决 本 问题 是 顺理成章 的 做 法 。 
(此 处 假设 我 们 必须 使 用 SQL 解决 本 问题 ， 如 果 能 以 函数 的 形式 存在 则 更 加 适合 。) 就 像 本 
书 的 其 他 实例 一 样 ， 或许 你 一 时 看 不 到 那些 解决 方案 的 实际 应 用 场景 ， 但 是 我 建议 你 重点 
关注 其 中 展示 的 技术 和 技巧 。 关 于 MODEL 子 句 ， 我 们 需要 认识 到 它 具 有 面向 过 程 编程 的 能 
力 ， 同 时 又 没有 丢掉 SQL 原 有 的 面向 集合 编程 的 能 力 。 因 此 ， 你 可 能 会 说 :“ 我 绝对 不 会 
用 SQL 做 这 些 事 。” 这 也 没有 关系 。 实 际 上 ， 我 不 会 建议 你 应 该 这 样 做 或 者 不 应 该 那样 做 。 
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我 只 是 提醒 你 把 注意 力 放 在 本 解决 方案 展示 的 技术 和 技巧 上 ， 这 样 今后 遇 到 更 适当 的 场景 








时 ， 它 自然 而 然 就 会 派 上 用 场 。 








7 

















过 程 ， 最 后 返回 一 个 值 ， 非 常 像 一 个 函数 做 的 事 。) 








1 select ename, 

2 sal, 

3 

4 select bin 

5 from dual 

6 model 

7 dimension by ( 0 attr ) 

8 measures ( sal num, 

9 cast(null as varchar2(30)) bin, 
10 '0123456789ABCDEF' hex 

11 ) 

12 rules iterate (10000) until (num[0] <= 0) ( 
13 bin[0] = substr(hex[cv()],mod(num[cv()],2)*1,1)| |bin[cv()], 
14 num[0] = trunc(num[cv()]/2) 

15 ) 

16 ) sal binary 


17 from emp 





下 面 给 出 的 解决 方案 从 EM 表 中 取出 了 全 部 ENAME 和 SAL， 同 时 又 以 标量 子 查询 的 形式 调 
用 了 MODEL 子 句 。( 该 标量 子 查 询 的 作用 类 似 于 一 个 独立 存在 的 函数 ， 接 受 输入 ， 启 动 处 理 





我 在 前 面 的 “解决 方案 ”部 分 中 提 到 过 ， 上 述 解 决 方案 最 好 能 以 函数 形式 存在 。 事 实 上 ， 
本 实例 的 灵感 确实 来 自 一 个 函数 。 我 把 一 个 名 为 TO. BASE 的 函数 做 了 些 改编 从 而 写 出 了 本 
实例 ， 该 函数 的 作者 是 Oracle 公司 的 Tom Kyte。 就 像 你 不 会 在 实际 工作 中 用 到 本 书 的 其 
他 许多 实例 一 样 ， 本 实例 的 代码 也 可 能 对 你 没有 什么 实用 价值 ， 但 不 可 否认 它 很 好 地 展示 























了 MODEL 子 句 的 部 分 功能 ， 例 如 迭代 和 以 数组 形式 访问 行 值 的 能 














为 了 便于 解释 ， 我 对 上 述 包含 MODEL 子 句 的 子 查询 做 了 一 点 轻微 的 改动 。 下 面 的 代码 下 
上 完全 等 同 于 上 述 解决 方案 里 的 那个 子 查 询 ， 但 是 我 让 它 仅 返回 数字 2 的 二 进 制 形 式 。 
select bin 
from dual 
model 


dimension by ( 0 attr ) 

measures ( 2 num， 
cast(null as varchar2(30)) bin, 
'0123456789ABCDEF' hex 


) 
rules iterate (10000) until (num[0] <= 0) ( 


bin[0] = substr (hex[cv()],mod(num[cv()],2)*1,1)| |bin[cv(O]; 
num[0] = trunc(num[cv()]/2) 





基本 
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下 面 的 查询 输出 了 上 述 RULES KAERA E 


select 2 start val, 
'0123456789ABCDEF' hex, 
substr('0123456789ABCDEF' ,mod(2,2)41,1) || 
cast(null as varchar2(30)) bin, 
trunc(2/2) num 











from dual 
START VAL HEX BIN NUM 
2 0123456789ABCDEF 0 1 


START. VAL 代表 我 们 希望 把 它 变 成 二 进 制 形式 的 整数 ， 本 例 中 为 2。BIN 的 值 是 针对 
0123456789ABCDEF (别名 为 HEX). 执行 子 字符 串 操 作 的 结果 。NUM 值 是 为 了 测试 何 时 退出 
循环 。 

如 上 述 结果 集 所 示 ， 第 一 次 循环 的 运算 结果 BIN 等 于 0，NUM 等 于 1。 由 于 NUM 不 满足 小 于 
或 等 于 0 的 条 件 ， 因 而 会 再 循环 一 次 。 下 面 的 SQL 语句 展示 了 下 一 次 迭代 的 结果 。 
































select num start_val, 
substr('0123456789ABCDEF' ,mod(1,2)+1,1) || bin bin, 
trunc(1/2) num 

from ( 

select 2 start val, 
'0123456789ABCDEF' hex, 
substr('0123456789ABCDEF' ,mod(2,2)41,1) || 
cast(null as varchar2(30)) bin, 
trunc(2/2) num 


from dual 
) 
START VAL BIN NUM 
1 10 0 











下 一 次 循环 和 运算， 针对 HEX 执行 的 子 字符 串 操 作 结果 返回 了 1， 它 后 面 要 接 上 前 一 次 的 BIN 
值 0。 测 试用 的 NUM 现在 等 于 0， 因 此 这 会 是 最 后 一 次 帮 代 ， 而 返回 值 10 是 数字 2 的 二 进 
制 表 示 。 如 果 你 能 理解 截止 目前 的 代码 ， 则 不 妨 去 掉 MODEL 子 句 里 的 迭代 语法 ， 从 而 可 以 
一 步 一 步 地 理解 最 终结 果 是 如 何 计算 出 来 ， 如 下 所 示 。 


select 2 orig val, num, bin 
from dual 
model 
dimension by ( O attr ) 
measures ( 2 num, 
cast(null as varchar2(30)) bin, 
'0123456789ABCDEF' hex 


) 
rules ( 
bin[0] = substr (hex[cv()],mod(num[cv()],2)*1,1)| |bin[cv(O]; 
num[0] = trunc(numn[cv()]/2), 
bin[1] = substr (hex[0],mod(num[0],2)41,1)| | bin[0], 


























num[1] = trunc(num[0]/2) 
) 


ORIG_VAL NUM BIN 


14.8 变换 已 排名 的 结果 集 


1. 问题 

你 想 为 一 个 表 里 的 记录 排名 ， 然 后 把 它 变换 成 一 个 3 列 的 结果 集 。 这 3 列 分 别 是 前 3 名 ， 
接 下 来 的 3 个 名 次 ， 然 后 是 其 余 各 行 记 录 。 例 如 ， 你 希望 根据 SAL 值 为 EM 表 的 员工 排名 ， 
并 把 结果 变换 成 一 个 3 列 的 结果 集 。 你 期 望 的 结果 集 如 下 所 示 。 





KING (5000) BLAKE (2850) TURNER (1500) 
FORD (3000) CLARK (2450) MILLER (1300) 
SCOTT (3000) ALLEN (1600) MARTIN (1250) 
JONES (2975) WARD (1250) 
ADAMS (1100) 
JAMES (950) 
SMITH (800) 


2. 解决 方案 

本 解决 方案 的 关键 是 先 借 助 窗口 函数 DENSE_RANK OVER 根据 SAL 为 员工 排名 ， 因 为 该 函数 允 
VF Tie 的 存在 。 有 了 DENSE RANK OVER 函数 ， 我 们 很 容易 查看 前 3 名 的 工资 ， 接 下 来 的 3 个 
次 高 的 工资 ， 以 及 其 余 工 资 。 

然后 ， 使 用 窗口 函数 ROW NUMBER OVER 在 每 个 分 组 内 部 (前 3 名 、 接 下 来 的 3 个 名 次 ,或 
其 余 各 行 记录 ) 为 员工 排序 。 然 后 ， 只 要 做 一 次 常规 的 行列 变换 操作 ， 并 借助 数据 库 
内 置 的 字符 串 函 数 对 查询 结果 做 出 适当 格式 化 即 可 。 下 面 的 解决 方案 使 用 Oracle 语法 。 
DB2 和 SQL Server 2005 都 支持 窗口 函数 ， 相 信 你 能 够 适当 地 修改 本 解决 方案 以 适用 于 
其 他 数据 库 。 


















































1 select max(case grp when 1 then rpad(ename,6) || 
2 ' (I| sal ||')' end) top. 3, 
3 max(case grp when 2 then rpad(ename,6) | 

4 ' (I| sal ||')' end) next 3, 
5 max(case grp when 3 then rpad(ename,6) || 
6 ' ('|] sal ||')' end) rest 

7 

8 


from ( 
select ename, 

9 sal, 

10 rnk, 

11 case when rnk <= 3 then 1 
12 when rnk <= 6 then 2 
13 else 3 
14 end grp, 
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15 row_number()over ( 


16 partition by case when rnk < 3 then 1 
17 when rnk <= 6 then 2 
18 else 3 
19 end 
20 order by sal desc, ename 
21 ) grp_rnk 
22 from ( 
23 select ename, 
24 sal, 
25 dense_rank()over(order by sal desc) rnk 
26 from emp 
27 ) x 
28 ) y 
29 group by grp_rnk 
3. 讨论 


本 实例 充分 展示 了 窗口 函数 的 威力 。 上 述 解决 方案 看 起 来 很 复杂 ， 
开 来 一 一 细 看 的 话 ， 就 会 发 现 其实 并 不 难 理解 。 我 们 先 从 内 散 视 图 


select ename, 




















sal, 
dense rank()over(order by sal desc) rnk 
from emp 
ENAME SAL RNK 
KING 5000 1 
SCOTT 3000 2 
FORD 3000 2 
JONES 2975 3 
BLAKE 2850 4 
CLARK 2450 5 
ALLEN 1600 6 
TURNER 1500 7 
MILLER 1300 8 
WARD 1250 9 
MARTIN 1250 9 
ADAMS 1100 10 
JAMES 950 11 
SMITH 800 12 


但 是 如 果 我 们 把 它 拆 解 
X 开始 。 


如 上 所 示 ， 内 艇 视图 X 根据 SAL 为 员工 排序 ， 同 时 又 允许 Tie 的 存在 。( 因 为 本 解决 方案 使 








用 的 是 DENSE_RANK 函数 而 不 是 RANK 函数 ，DENSE_RANK 不 仅 允 许 Tie 的 存在 ， 还 能 保证 名 


次 连续 ， 中 间 不 留 空白 。) 下 一 步 是 从 内 髓 视图 X 里 提取 出 各 行 数 据 ， 并 借助 CASE 表达 式 
评估 DENSE RANK 返回 的 排名 结果 从 而 实现 分 组 。 除 此 之 外 ， 还 要 调用 窗口 函数 ROW. NUMBER 
OVER 根据 SAL 对 员工 进行 组 内 编号 (在 前 面 由 CASE 表达 式 实现 的 分 组 里 )。 所 有 这 些 都 由 























ARLE Y 实现 的 ， 如 下 所 示 。 


select ename, 
sal, 
rnk, 
case when rnk <= 3 then 1 





when rnk <= 6 then 2 
else 3 
end grp, 
row_number()over ( 
partition by case when rnk <= 3 then 1 
when rnk <= 6 then 2 


else 3 
end 
order by sal desc, ename 
) grp rnk 
from ( 

select ename, 

sal, 

dense rank()over(order by sal desc) rnk 

from emp 

)x 
ENAME SAL RNK GRP GRP_RNK 
KING 5000 1 1 1 
FORD 3000 2 1 2 
SCOTT 3000 2 1 3 
JONES 2975 3 1 4 
BLAKE 2850 4 2 1 
CLARK 2450 5 2 2 
ALLEN 1600 6 2 3 
TURNER 1500 7 3 1 
MILLER 1300 8 3 2 
MARTIN 1250 9 3 3 
WARD 1250 9 3 4 
ADAMS 1100 10 3 5 
JAMES 950 11 3 6 
SMITH 800 12 3 7 


查询 语句 越 来 越 接近 最 终 的 形态 了 ， 并 且 如 果 你 是 从 开始 部 分 (从 









































以 及 GRP. RANK. (在 每 一 个 分 组 内 基于 SAL 生成 的 编号 ) 。 
现在 ， 我 们 要 执行 一 次 传统 的 行列 翻转 ， 同 时 使 用 Oracle 的 字符 上 


ARIE X) 一 直 读 到 
这 里 的 话 ， 一 定 会 发 现 其 实 该 查询 并 不 是 那么 难以 理解 。 上 述 查 询 返 回 了 每 个 员工 的 SAL, 
RNK (代表 该 员工 的 SAL 在 全 体 员工 中 的 排名 )、GRP (根据 每 个 员工 的 SAL 产生 的 分 组 )， 





连接 操作 符 | | F 





巴 SAL 


附加 在 ENAME 的 后 面 。 函 数 RPAD 确保 圆 括号 里 的 数值 能 够 上 下 对 齐 。 最 后 ， 针 对 GRP. RNK 








执行 GROUP BY 操作 以 确保 结果 集 能 包含 所 有 员工 。 最 终 的 结果 集 如 1 


select max(case grp when 1 then rpad(ename,6) || 
' C'I] sal ||')' end) top. 3, 
max(case grp when 2 then rpad(ename,6) || 
' C [| sal ||')' end) next 3, 
max(case grp when 3 then rpad(ename,6) || 
' C [I sal ||')' end) rest 
from ( 
select ename, 
sal, 
rnk, 


下 所 示 。 





from 
select 


from 


group 


KING 
FORD 
SCOTT 
JONES 


case when rnk <= 3 then 1 
when rnk <= 6 then 2 
else 3 
end grp, 
row_number()over ( 
partition by case when rnk <= 3 then 1 
when rnk <= 6 then 2 


else 3 
end 
order by sal desc, ename 
) grp_rnk 
( 
ename， 
sal, 
dense_rank()over(order by sal desc) rnk 
emp 
) x 
)y 
by grp_rnk 
NEXT_3 REST 
(5000) BLAKE (2850) TURNER (1500) 


(3000) CLARK (2450) MILLER (1300) 

(3000) ALLEN (1600) MARTIN (1250) 

(2975) WARD (1250) 
ADAMS (1100) 
JAMES (950) 
SMITH (800) 


仔细 观察 以 上 每 一 步 的 查询 语句 ， 我 们 会 发 现 直接 读 取 EMP 表 的 操作 其 实 只 发 生 了 一 次 。 
窗口 了 国 数 最 为 引 人 注 目的 功能 之 一 就 是 ， 只 需 访问 一 次 原始 数据 就 可 以 完成 很 多 复杂 的 任 
务 。 不 需要 自 连接 或 临时 表 ， 只 要 准备 好 必要 的 基础 数据 集 ， 剩 下 的 工作 交 给 窗口 函数 处 
理 就 行 了 。 我 们 只 需要 在 内 骨 视 图 Xx 中 访问 一 次 EMP 表 。 此 后 ， 只 要 多 次 变换 该 查询 结果 
直到 得 出 我 们 希望 看 到 的 结果 集 即 可 。 想 想 我 们 创建 出 了 这 么 复杂 的 报表 ， 却 只 读 取 过 一 















































次 原始 数据 ， 真 是 非常 酷 。 
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1. 问题 
你 想 把 两 个 结 





为 两 次 变换 后 的 结果 集 增加 列 标题 

















吉 果 集合 加 起 来 ， 并 把 它们 转换 成 两 列 。 除 此 之 外 ， 你 还 希望 为 每 一 列 中 的 每 








一 组 行 数据 增加 一 个 列 标题 。 例 如 ， 你 有 两 个 表 ， 它 们 分 别 是 公司 里 从 事 两 个 不 同 领域 工 
作 的 员工 名 单 (假设 是 研究 领域 和 应 用 领域 )。 


select * from it_research 





DEPTNO ENAME 


100 HOPKINS 
100 JONES 
100 TONEY 
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200 MORALES 
200 P.WHITAKER 
200 MARCIANO 
200 ROBINSON 
300 LACY 

300 WRIGHT 

300 J.TAYLOR 


select * from it apps 


DEPTNO ENAME 
400 CORRALES 
400 MAYWEATHER 
400 CASTILLO 
400 MARQUEZ 
400 MOSLEY 
500 GATTI 
500 CALZAGHE 
600 LAMOTTA 
600 HAGLER 
600 HEARNS 
600 FRAZIER 
700 GUINN 
700 JUDAH 
700 MARGARITO 


你 希望 创建 一 个 报表 ， 分 两 列 列 出 每 个 表 的 员工 。 你 也 希望 返回 每 个 DEPTNO 下 的 ENAME, 
最 终 你 想得到 如 下 所 示 的 结果 集 。 











RESEARCH APPS 
100 400 
JONES MAYWEATHER 
TONEY CASTILLO 
HOPKINS MARQUEZ 
200 MOSLEY 
P.WHITAKER CORRALES 
MARCIANO 500 
ROBINSON CALZAGHE 
MORALES GATTI 
300 600 
WRIGHT HAGLER 
J.TAYLOR HEARNS 
LACY FRAZIER 
LAMOTTA 
700 
JUDAH 
MARGARITO 
GUINN 
2. 解决 方案 











基本 上 ， 本 解决 方案 只 需要 一 个 简单 的 stack-n-pivot 操作 〈 先 执行 UNION 操作 ， 然 后 再 
做 行列 翻转 )。 除 此 之 外 ， 还 要 做 一 个 额外 的 操作 : DEPTNO 必须 要 先 于 ENAME 被 返回 。 这 




















L 





里 使 用 的 技巧 是 ,借助 第 卡 儿 积 为 每 个 DEPTNO 产生 一 行 额外 的 数据 ， 这 样 我 们 就 不 仅 得 
到 所 有 员工 的 数据 ， 也 得 到 了 DEPTNO 对 应 的 行 。 本 解决 方案 采用 Oracle 语法 ， 但 是 由 于 
DB2 的 窗口 函数 也 支持 滑动 窗口 (Framing 子 句 )， 适当 修 改 一 下 本 解决 方案 不 难得 到 适用 


于 DB2 的 代码 。 因 为 IT_ RESEARCH RFN IT. APPS 表 只 为 本 实例 而 存在 ， 下 面 的 解决 方案 上 
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也 顺便 列 出 了 创建 这 些 表 的 语句 。 


create 


insert 
insert 
insert 
insert 
insert 
insert 
insert 
insert 
insert 
insert 


create 


insert 
insert 
insert 
insert 
insert 
insert 
insert 
insert 
insert 
insert 
insert 
insert 
insert 
insert 


se 


se 


se 


NO OO —+l ON t Q) N H 


11 se 


14 se 


17 


tabl 


into 
into 
into 
into 
into 
into 
into 
into 
into 
into 


tabl 


into 
into 
into 
into 
into 
into 
into 
into 
into 
into 
into 
into 
into 
into 


lect 
from 
lect 
from 


lect 


from 
lect 


from 
lect 


from 


e IT research (deptno number, ename varchar2(20)) 


IT research values (100, 'HOPKINS') 

IT research values (100, 'JONES') 

IT research values (100,'TONEY') 

IT research values (200, 'MORALES') 

IT research values (200,'P.WHITAKER') 
IT research values (200,'MARCIANO') 
IT research values (200, 'ROBINSON') 
IT research values (300,'LACY') 

IT research values (300, 'WRIGHT') 

IT research values (300,'J.TAYLOR') 


e IT apps (deptno number, ename varchar2(20)) 


IT apps values (400,'CORRALES') 
IT apps values (400, 'MAYWEATHER' ) 
IT apps values (400,'CASTILLO') 
IT apps values (400,'MARQUEZ') 
IT apps values (400,'MOSLEY') 

IT apps values (500,'GATTI') 

IT apps values (500,'CALZAGHE') 
IT apps values (600,'LAMOTTA') 
IT apps values (600,'HAGLER') 

IT apps values (600,'HEARNS') 

IT apps values (600,'FRAZIER') 
IT apps values (700,'GUINN') 

IT apps values (700,'JUDAH') 

IT apps values (700,'MARGARITO') 


max(decode(flag2,0,it dept)) research, 
max(decode(flag2,1,it dept)) apps 
( 
sum(flagi)over(partition by flag2 
order by flagi,rownum) flag, 
it dept, flag2 
( 
1 flagi, 0 flag2, 
decode(rn,1,to char(deptno),' "'||ename) it dept 
( 
x.*, y.id, 
row number(J)over(partition by x.deptno order by y.id) rn 
( 
deptno, 
ename, 
count(*)over(partition by deptno) cnt 
it research 





18 J Xs 

19 (select level id from dual connect by level <= 2) y 
20 ) 

21 where rn <= cnt+1 

22 union all 

23 select 1 flagi, 1 flag2, 


24 decode(rn,1,to char(deptno),' '||ename) it dept 

25 from ( 

26 select x.*, y.id, 

27 row number(J)over(partition by x.deptno order by y.id) rn 
28 from ( 

29 select deptno, 

30 ename, 

31 count(*)over(partition by deptno) cnt 

32 from it apps 

33 ) x, 

34 (select level id from dual connect by level <= 2) y 
35 ) 

36 where rn <= cnt+1 

37 ) tmp1 

38 ) tmp2 


39 group by flag 


3. 讨论 

















>< 











和 其 他 的 数据 仓库 和 报表 类 型 的 查询 一 样 ， 上 述 解决 方案 看 起 来 相当 复杂 ， 但 是 如 果 拆 解 
开 来 一 一 细 看 的 话 ， 不 难 发 现 它 其 实 是 一 个 stack-n-pivot 操作 ， 外 加 一 个 笛 卡 儿 积 ( 困 
EE 重重 且 没有 任何 办 法 )。 拆 解 上 述 查 询 的 方法 是 先 仔细 查看 UNION ALL 的 每 个 组 成 部 分 ， 

















然后 再 把 它们 合并 起 来 做 行列 变换 。 先 从 UNION ALL 的 后 半 部 分 开始 。 


select 1 fLag1，1 flag2, 
decode(rn,1,to char(deptno),' '||ename) it dept 
from ( 
select x.*, y.id, 
row number()over(partition by x.deptno order by y.id) rn 
from ( 
select deptno, 
ename， 
count(*)over(partition by deptno) cnt 
from it apps 
) x, 
(select level id from dual connect by level <= 2) y 
)z 


where rn <= cnt+1 


FLAG1 FLAG2 IT DEPT 

400 
MAYWEATHER 
CASTILLO 
MARQUEZ 
MOSLEY 
CORRALES 

500 
CALZAGHE 


B pp pP F pP = = 
B =p = F P == 
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1 1 GATTI 

1 1 600 

1 1 HAGLER 

1 1 HEARNS 

1 1 FRAZIER 

1 1  LAMOTTA 

1 1 700 

1 1 JUDAH 

1 1 MARGARITO 
1 1  GUINN 





仔细 看 一 下 上 述 结果 集 究竟 是 怎么 拼 竣 出 来 的 。 把 上 面 的 查询 分 解 成 最 基本 的 组 成 部 分 ， 
即 可 得 到 内 艇 视图 X， 该 视图 从 IT APPS 表 里 取出 每 个 ENAME 和 DEPTN0， 并 计算 出 每 个 
DEPTNO 对 应 的 员工 人 数 。 结 果 如 下 所 示 。 


select deptno deptno， 
ename, 
count(*)over(partition by deptno) cnt 
from it apps 


























DEPTNO ENAME CNT 
400 CORRALES 
400 MAYWEATHER 
400 CASTILLO 
400 MARQUEZ 
400 MOSLEY 
500 GATTI 
500 CALZAGHE 
600 LAMOTTA 
600 HAGLER 
600 HEARNS 
600 FRAZIER 
700 GUINN 
700 JUDAH 
700 MARGARITO 


F aE NAMES] X 返回 的 行 和 由 CONNECT BY 从 DUAL 表 中 产生 出 来 的 两 行 数据 创建 一 
个 笛 卡 儿 积 。 该 操作 的 结果 集 显示 如 下 。 


select * 
from ( 
select deptno deptno, 
ename, 
count(*)over(partition by deptno) cnt 
from it apps 


UJ UJ UJ + + Ñ+ + FS NJ Ui Ui Ui Ui Ui 


























) x, 

(select level id from dual connect by level <= 2) y 
order by 2 
DEPTNO ENAME CNT ID 


500 CALZAGHE 2 1 
500 CALZAGHE 2 2 
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Ea 
= 


400 CASTILLO 
400 CASTILLO 
400 CORRALES 
400 CORRALES 
600 FRAZIER 
600 FRAZIER 
500 GATTI 

500 GATTI 

700 GUINN 

700 GUINN 

600 HAGLER 
600 HAGLER 
600 HEARNS 
600 HEARNS 
700 JUDAH 

700 JUDAH 

600 LAMOTTA 
600 LAMOTTA 
700 MARGARITO 
700 MARGARITO 
400 MARQUEZ 
400 MARQUEZ 
400 MAYWEATHER 
400 MAYWEATHER 
400 MOSLEY 
400 MOSLEY 


AW EB. ATFERLI EVER ABS] X 的 每 一 行 数 据 都 被 返回 了 两 次 。 不 用 着 急 ， 你 
很 快 就 会 明白 为 什么 此 处 需要 一 个 笛 卡 儿 积 。 下 一 步 是 根据 ID (Ip 的 值 为 1 或 2， 这 是 由 
笛 卡 儿 积 生成 的 ) 为 当前 结果 集中 每 个 DEPTNO 对 应 的 员工 进行 编号 。 编 号 的 结果 显示 在 下 
下 查询 的 输出 部 分 。 


select x.*, y.id, 
row number()over(partition by x.deptno order by y.id) rn 
from ( 
select deptno deptno, 
ename, 
count(*)over(partition by deptno) cnt 
from it apps 
) x, 
(select level id from dual connect by level <= 2) y 


Un (n Un (n (n Un QQ Q + + WUWA + P+ + UU Q NJ) S + + U Q Ui Ui 
N P. N P. N F. N F. N FB NÑ F. NJ) F. NJ) P. NJ) F. NÑ F. NJ) F. Ñ P. Ñ PF 


















































DEPTNO ENAME CNT ID RN 
400 CORRALES 
400 MAYWEATHER 
400 CASTILLO 
400 MARQUEZ 
400 MOSLEY 
400 CORRALES 
400 MOSLEY 
400 MAYWEATHER 
400 CASTILLO 
400 MARQUEZ 


mmmmmmmmwm Ui 
N.N N N NN P. F. F. H = 
\D om、~ O 3 + QO N P 


= 
e 
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500 GATTI 2 1 1 
500 CALZAGHE 2 1 2 
500 GATTI 2 2 3 
500 CALZAGHE 2 2 4 
600 LAMOTTA 4 1 1 
600 HAGLER 4 1 2 
600 HEARNS 4 1 3 
600 FRAZIER 4 1 4 
600 LAMOTTA 4 2 5 
600 HAGLER 4 2 6 
600 FRAZIER 4 2 7 
600 HEARNS 4 2 8 
700 GUINN 3 1 1 
700 JUDAH 3 1 2 
700 MARGARITO 3 1 3 
700 GUINN 3 2 4 
700 JUDAH 3: 2.52. 5 
700 MARGARITO 3 2 6 


每 个 员工 都 有 了 一 个 编号 ， 并 且 ， 他 们 的 重复 项 也 都 被 分 配 了 编号 。 上 述 结果 集中 包含 了 
IT APP 表 里 的 所 有 员工 及 其 重复 项 ， 以 及 基于 所 属 DEPTNO 为 每 一 行 生成 的 编号 。 我 们 需 


























X 




















\ 生 成 这 些 重复 项 的 原因 是 ， 因 为 我 们 需要 在 结果 集中 留 一 个 缝隙 把 DEPTO 插入 到 





ENAME 列 。 如 果 我 们 把 一 个 只 有 1 行 数据 的 表 和 IT_APPS 表 连 接 起 来 做 笛 卡 儿 积 ， 就 无 法 
得 到 这 些 额 外 的 行 。( 因 为 一 个 表 的 记录 条 数 乘 以 1 的 结果 仍然 会 等 于 该 表 的 记录 条 数 。) 


下 一 步 是 把 到 目前 为 止 的 结果 集 做 行列 翻转 操作 ， 这 样 ENAMES 会 以 一 列 的 形式 返回 ， 但 会 























先 返回 他 们 所 属 的 DEPTN0。 如 下 所 示 的 查询 展示 了 这 一 操作 过 程 。 


select 1 flag1, 1 flag2, 
decode(rn,1,to char(deptno),' '||ename) it dept 
from ( 
select x.*, y.id, 
row number()over(partition by x.deptno order by y.id) rn 
from ( 
select deptno deptno, 
ename, 
count(*)over(partition by deptno) cnt 
from it apps 
) x, 
(select level id from dual connect by level <= 2) y 
) z 


where rn <= cnt+1 


n 











FLAG1 FLAG2 IT. DEPT 

400 
MAYWEATHER 
CASTILLO 
MARQUEZ 
MOSLEY 
CORRALES 

500 
CALZAGHE 


| HH P pp P= P= 
PpAPPAPPAPAP 








GATTI 
600 
HAGLER 
HEARNS 
FRAZIER 
LAMOTTA 
700 
JUDAH 
MARGARITO 
GUINN 


F. HB BH P. P. R. X X x 


1 
1 
1 
1 
1 
1 
1 
1 
1 
1 


先 暂 时 忽略 掉 FLAG1 和 FLAG2， 稍 后 再 做 讨论 。 注 意 观 察 上 述 IT DEPT 列 的 结果 。 每 个 


DEPTNO 返回 





的 记录 行 数 是 CNT*2， 但 实际 上 只 需要 CNT+1 行 记录 ，WHERE 子 句 的 过 滤 条 件 


会 限制 记录 行 数 。RN 是 每 个 员工 的 编号 ， 所 有 编号 值 小 于 或 等 于 CNT+1 的 行 都 会 被 保留 


下 来 。 也 就 是 说 ， 每 个 DEPTNO 对 应 的 所 有 员工 再 加 上 额 多 








的 1 行 记录 会 被 保留 下 来 ( 额 


外 的 那 1 行 记录 是 每 个 DEPTNO 对 应 的 编号 最 小 的 员工 )。 这 一 行 额外 的 记录 就 是 用 来 插入 
DEPTNO 的 地 方 。 调 用 DECODE 孙 数 (该 函数 的 功能 类 似 于 CASE 表达 式 ， 早 期 Oracle 版 本 已 
经 支持 该 函数 ) 判定 RN 的 值 ， 并 把 DEPTNO 插入 到 结果 集 里 。RN 值 等 于 1 的 员工 不 会 被 漏 
掉 ， 但 会 被 放 在 每 个 DEPTO 的 最 后 位 置 (因为 顺序 无 关 紧 要 ， 放 在 最 后 也 没有 关系 )。 至 
此 为 止 ， 我 们 已 经 详尽 地 讨论 了 UNION ALL 的 后 半 部 分 。 


UNION ALL 的 前 半 部 分 过 程 和 后 半 部 分 相同 ， 因 此 就 没 必 要 再 重复 讨论 了 。 下 夯 










































































下 两 个 查询 结果 有 全 加 后 的 结果 集 。 


select 1 flag1, 0 flag2, 
decode(rn,1,to char(deptno),' '|lename) it dept 
from ( 
select x.*, y.id, 
row number()over(partition by x.deptno order by y.id) rn 
from ( 
select deptno, 
ename， 
count(*)over(partition by deptno) cnt 
from it research 
) x, 
(select level id from dual connect by level <= 2) y 
) 
where rn <= cnt+1 
union all 
select 1 flagi, 1 flag2, 
decode(rn,1,to char(deptno),' "'|[|ename) it dept 
from ( 
select x.*, y.id, 
row number()over(partition by x.deptno order by y.id) rn 
from ( 
select deptno deptno, 
ename, 
count(*)over(partition by deptno) cnt 
from it apps 
) x, 
(select level id from dual connect by level <= 2) y 











i 仔细 观察 一 








where rn <= cnt+1 


FLAG1 FLAG2 IT_DEPT 


0 

0 

0 

0 HOPKINS 

0 200 

©  P.WHITAKER 
© MARCIANO 
© ROBINSON 
© MORALES 

0 300 

0 WRIGHT 

0  J.TAYLOR 
0 LACY 

1 400 

1 MAYWEATHER 
1 CASTILLO 
1 MARQUEZ 
1  MOSLEY 

1 CORRALES 
1 500 

1 CALZAGHE 
1 GATTI 

1 600 

1 HAGLER 

1 HEARNS 

1  FRAZIER 
1  LAMOTTA 
1 700 

1 JUDAH 

1 MARGARITO 
1  GUINN 


FB pH HR HH HB H B B H RB pB BH BH BH BR B BH B B RB B H HB HB H HB H H HB H 





此 时 你 或 许 还 不 明白 FLAG1 的 作用 ， 但 可 以 看 出 FLAG2 被 用 来 标识 行 记录 来 自 UNION ALL 的 


哪个 部 分 (0 表示 前 半 部 门 ，1 表示 后 半 部 分 )。 


























下 一 步 是 把 辣 加 后 的 结果 集 包 右 在 一 个 内 柚 视 图 里 ， 并 计算 FLAG1 的 累计 合计 值 (终于 知 
道 它 的 作用 了 ! )， 该 累计 合计 值 可 以 看 作 是 UNION ALL 的 两 个 数据 子 集 内 部 各 自生 成 的 行 





























编号 。 编 号 后 的 结果 集 (累计 合计 值 ) 如 下 所 示 。 


select sum(flagi)over(partition by flag2 
order by flagi,rownum) flag, 








it dept, flag2 
from ( 
select 1 flagi, 0 flag2, 
decode(rn,1,to char(deptno),' "'||ename) it dept 
from ( 
select x.*, y.id, 
row number()over(partition by x.deptno order by y.id) rn 
from ( 
select deptno, 





ename, 
count(*)over(partition by deptno) cnt 
from it research 
)x, 
(select level id from dual connect by level «- 2) y 
) 
where rn <= cnt+1 
union all 
select 1 flagi, 1 flag2, 
decode(rn,1,to char(deptno),' "'||ename) it dept 
from ( 
select x.*, y.id, 
row number()over(partition by x.deptno order by y.id) rn 
from ( 
select deptno deptno, 
ename, 
count(*)over(partition by deptno) cnt 
from it apps 


) x, 

(select level id from dual connect by level <= 2) y 

) 

where rn <= cnt+1 
) tmp1 
FLAG IT DEPT FLAG2 

1 100 0 
2 JONES 0 
3 TONEY 0 
4 HOPKINS 0 
5 200 0 
6 P.WHITAKER 0 
7 MARCIANO 0 
8 ROBINSON 0 
9 MORALES 0 
10 300 0 
11 WRIGHT 0 
12 J. TAYLOR 0 
13 LACY 0 
1 400 1 
2 MAYWEATHER 1 
3 CASTILLO 1 
4 MARQUEZ 1 
5 MOSLEY 1 
6 CORRALES 1 
7 500 1 
8 CALZAGHE 1 
9 GATTI 1 
10 600 1 
11 HAGLER 1 
12 HEARNS 1 
13 FRAZIER 1 
14 LAMOTTA 1 
15 700 1 
16 JUDAH 1 





17 MARGARIT 1 
18 GUINN 1 


剩 下 的 最 后 一 步 是 ， 基 于 FLAG2 把 TMP1 的 返回 值 做 行列 翻转 ， 同 时 也 要 按照 FLAG (TMP1 
中 生成 的 累计 合计 值 ) 进行 分 组 。 把 TMP1 的 查询 结果 包 囊 在 一 个 内 髓 视图 〈 最 外 层 的 内 内 























视图 TMP2) 里 ， 并 做 行列 翻转 。 最 终 的 解决 方案 和 结果 集 显示 如 下 。 


select max(decode(flag2,0,it dept)) research, 
max(decode(flag2,1,it dept)) apps 
from ( 
select sum(flagi)over(partition by flag2 
order by flagi,rownum) flag, 
it dept, flag2 
from ( 
select 1 flagi, 0 flag2, 
decode(rn,1,to char(deptno),' "'||ename) it dept 
from ( 
select x.*, y.id, 
row number()over(partition by x.deptno order by y.id) rn 
from ( 
select deptno, 
ename, 
count(*)over(partition by deptno) cnt 
from it research 


) x, 
(select level id from dual connect by level <= 2) y 
) 
where rn <= cnt+1 
union all 
select 1 flag1, 1 flag2, 
decode(rn,1,to char(deptno),' "'||ename) it dept 
from ( 


select x.*, y.id, 
row number()over(partition by x.deptno order by y.id) rn 
from ( 
select deptno deptno, 
ename, 
count(*)over(partition by deptno) cnt 
from it apps 
) x, 
(select level id from dual connect by level <= 2) y 
) 
where rn <= cnt+1 
) tmp1 
) tmp2 
group by flag 


RESEARCH APPS 

100 400 
JONES MAYWEATHER 
TONEY CASTILLO 
HOPKINS MARQUEZ 

200 MOSLEY 
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P.WHITAKER CORRALES 
MARCIANO 500 
ROBINSON CALZAGHE 
MORALES GATTI 
300 600 
WRIGHT HAGLER 
J.TAYLOR HEARNS 
LACY FRAZIER 
LAMOTTA 
700 
JUDAH 
MARGARITO 
GUINN 


在 Oracle 中 把 标量 子 查询 转换 为 复合 子 
查询 


14.10 


1. 问题 
一 个 标量 子 查询 中 只 允许 返回 
查询 。 
select e.deptno, 
e.ename, 
e.sal, 
(select d.dname,d.loc,sysdate today 
from dept d 
where e.deptno=d.deptno) 
from emp e 


上 述 查 询 会 因为 报错 而 无 法 执行 ， 
2. 解决 方案 

诚然 ， 上 述 问 题 似 乎 有 些 不 切实 际 ， 因 为 只 要 把 EMP 表 和 DEPT 表 连 接 起 来 ， 我 们 就 能 方便 
地 从 DEPT 表 中 提取 出 任意 值 。 但 是 ， 我 的 本 意 是 希望 你 关注 技巧 ， 并 认识 到 本 问题 在 某 些 
场景 下 有 其 实用 性 。 当 在 SELECT 中 放 入 了 另 一 个 SELECT (标量 子 查询 ) PF, 4826 


一 个 值 ， 你 想 绕 过 该 限制 。 例 如 ， 你 尝试 执行 如 下 所 示 的 








因为 SELECT 列表 里 的 子 查 询 只 允许 返回 一 个 值 。 





























RLR 
返回 一 个 值 的 限制 ， 就 需要 利用 Oracle 的 对 象 类 型 。 我 们 可 以 定义 一 个 拥有 多 个 属性 的 对 
象 ， 然 后 把 它 作 为 一 个 单独 的 实体 来 处 理 ， 并 且 可 以 访问 其 中 的 每 一 个 属性 。 实 际 上 ， 我 
们 并 没有 真正 地 打破 那个 规则 。 它 仍然 只 返回 了 一 个 值 ， 只 不 过 该 返回 值 是 一 个 对 象 ， 它 
里 面包 含 了 许多 属性 。 


本 解决 方案 使 用 到 了 下 面 的 对 象 类 型 。 


create type generic_obj 
as object ( 
vall varchar2(10), 
val2 varchar2(10), 
val3 date 
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有 了 以 上 对 象 类 型 ， 就 可 以 执行 下 面 的 查询 。 


1 
2 
3 
4 
5 
6 
7 
8 
9 


10 
11 
12 
13 
14 


se 


se 


lect 


x 
x 
x 
x 
x 
from ( 
e 
e 
e 
( 


DEPTNO ENAME 














.deptno, 

.ename， 
.multival.vali dname, 
.multival.val2 loc, 
.multival.val3 today 


12-SEP-2005 
12-SEP-2005 
12-SEP-2005 
12-SEP-2005 
12-SEP-2005 
12-SEP-2005 
12-SEP-2005 
12-SEP-2005 
12-SEP-2005 
12-SEP-2005 
12-SEP-2005 
12-SEP-2005 
12-SEP-2005 


lect e.deptno, 
.ename, 
.sal, 
select generic obj(d.dname,d.loc,sysdate«1) 
from dept d 
where e.deptno-d.deptno) multival 
from emp e 
)x 
DNAME LOC 
SMITH RESEARCH DALLAS 
ALLEN SALES CHICAGO 
WARD SALES CHICAGO 
JONES RESEARCH DALLAS 
MARTIN SALES CHICAGO 
BLAKE SALES CHICAGO 
CLARK ACCOUNTING NEW YORK 
SCOTT RESEARCH DALLAS 
KING ACCOUNTING NEW YORK 
TURNER SALES CHICAGO 
ADAMS RESEARCH DALLAS 
JAMES SALES CHICAGO 
FORD RESEARCH DALLAS 
MILLER ACCOUNTING NEW YORK 


3. 讨论 


12-SEP-2005 


本 解决 方案 的 关键 在 于 使 用 上 述 对 象 的 构造 函数 (默认 情况 下 构造 函数 和 对 象 同 名 )。 因 
为 对 象 本 身 是 一 个 标量 值 ， 它 并 不 会 违反 标量 子 查询 的 规则 ， 如 下 所 示 。 


select e.deptno, 


DE 


800 GENERIC OBJ('RESEARCH', 'DALLAS', '12-SEP-2005') 


from 


PTNO 


e.enam 
e.sal, 





e, 


(select generic obj(d.dname,d.loc,sysdate-1) 


fro 


m dept d 


where e.deptno=d.deptno) multival 


emp e 


ENAME 


MARTIN 
BLAKE 


SAL MULTIVAL(VAL1, VAL2, VAL3) 


1600 GENERIC_OBJ('SALES', 'CHICAGO', 
1250 GENERIC_OBJ('SALES', 'CHICAGO', 


2975 GENERIC_OBJ('RESEARCH', 'DALLAS', '12-SEP-2005') 


1250 GENERIC_OBJ('SALES', 'CHICAGO', 
2850 GENERIC_OBJ('SALES', 'CHICAGO', 


'12-SEP-2005') 
'12-SEP-2005') 


'12-SEP-2005') 
'12-SEP-2005') 








10 CLARK 2450 GENERIC_OBJ('ACCOUNTING', 'NEW YORK', '12-SEP-2005') 

20 SCOTT 3000 GENERIC_OBJ('RESEARCH', 'DALLAS', '12-SEP-2005') 

10 KING 5000 GENERIC_OBJ('ACCOUNTING', 'NEW YORK', '12-SEP-2005') 

30 TURNER 1500 GENERIC_OBJ('SALES', 'CHICAGO', '12-SEP-2005') 

20 ADAMS 1100 GENERIC_OBJ('RESEARCH', 'DALLAS', '12-SEP-2005') 

30 JAMES 950 GENERIC OBJ('SALES', 'CHICAGO', '12-SEP-2005') 

20 FORD 3000 GENERIC OBJ('RESEARCH', 'DALLAS', '12-SEP-2005') 

10 MILLER 1300 GENERIC OBJ('ACCOUNTING', 'NEW YORK', '12-SEP-2005') 
BTE, HUEHE EXE 18) 0128 UE— BAH, HeRR ERN, 





县 


重要 提示 : Oracle 不 同 于 其 他 数据 库 ， 内 筷 视图 





不 一 定 非 要 有 别名 。 但 对 于 





























ED 本 例 而 言 ， 我 们 必须 为 上 述 内 嵌 视 图 指定 一 个 别名 。 否 则 ， 我 们 就 无 法 访问 
对 象 的 属性 。 
Z= 类 
14.11 解析 串 行 化 的 数据 
1. 问题 
你 有 串 行 化 的 数据 〈 以 字符 串 形 式 存 储 ) ， 你 希望 解析 这 些 字 符 串 并 以 行 的 形式 返回 。 例 
如 ， 你 的 数据 如 下 所 示 。 
STRINGS 
Bwtrysstewiegriffim latban. — 
entry:moe::sizlack: 
entry:petergriffin:meg:chris: 
entry:willie: 
entry:quagmire:mayorwest:cleveland: 
entry: ::flanders: 
Entry:robo:tchi:ken: 
你 希望 把 这 些 字 符 串 转换 成 如 下 所 示 的 结果 集 。 
VAL1 VAL2 VAL3 
"LCD sik —— 
petergriffin meg chris 
quagmire mayorwest Cleveland 
robo tchi ken 
stewiegriffin lois brian 
willie 
flanders 
2. 解决 方案 
本 例 中 的 每 个 字符 串 最 多 有 3 个 值 构成 。 慎 号 分 隔 ， 但 是 不 一 定 每 个 字符 串 都 包 


含 3 个 值 。 mi + 字符 串 包 含 的 值 不 足 3 个 





， 我 们 必须 小 心地 处 理 这 种 状况 ， 确 保 解析 


出 来 的 值 被 放 入 正确 的 列 里 。 芳 讶 如 下 所 示 的 ， 行 数据 ， 














entry:::flanders: 
这 行 数据 里 缺少 了 前 面 两 个 值 ， 仅 剩 下 第 3 


个 值 。 





因此 ， 和 仔细 观察 “问题 ”部 分 给 





LL 




















的 结果 集 ， 会 发 现 “flanders” 这 一 行 VAL1 和 VAL2 的 值 都 是 Null, 


本 解决 方案 的 关键 在 于 遍历 字符 串 并 解析 字符 串 ， 最 后 再 执行 一 个 简单 的 行列 翻转 操作 。 
我 们 还 用 到 了 视图 V， 下 面 给 出 了 该 视图 的 定义 。 另 外 ， 这 里 使 用 的 是 Oracle 语法 ， 由 于 
本 实例 仅 涉 及 部 分 字符 串 解析 函数 的 调用 ， 相 信 你 能 很 容易 地 修改 代码 使 之 适用 于 其 他 数 
据 库 。 


create view V 
as 
select 'entry:stewiegriffin:lois:brian:' strings 
from dual 
union all 
select 'entry:moe::sizlack:' 
from dual 
union all 
select 'entry:petergriffin:meg:chris:' 
from dual 
union all 
select 'entry:willie:' 
from dual 
union all 
select 'entry:quagmire:mayorwest:cleveland:' 
from dual 
union all 
select 'entry:::flanders:' 
from dual 
union all 
select 'entry:robo:tchi:ken:' 
from dual 


视图 v 负责 提供 示例 数据 ， 解 决 方案 如 下 所 示 。 






































1 with cartesian as ( 

2 select level id 

3 from dual 

4 connect by level «- 100 

5 ) 

6 select max(decode(id,1,substr(strings,p1+1,p2-1))) vall, 

7 max(decode(id,2,substr(strings,p1*1,p2-1))) val2, 

8 max(decode(id,3,substr(strings,p1*1,p2-1))) val3 

9 from ( 

10 select v.strings, 

11 c.id, 

12 instr(v.strings, ':',1,c.id) p1, 

13 instr(v.strings, ':',1,c.id«1)-instr(v.strings,':',1,c.id) p2 
14 from v, cartesian c 

15 where c.id <= (length(v.strings)-length(replace(v.strings,':')))-1 
16 ) 


17 group by strings 
18 order by 1 





with cartesian as ( 
select level id 

from dual 

connect by level «- 100 
) 
select v.strings, 

C. id 
from v,cartesian c 
where c.id <= (length(v.strings)-length(replace(v.strings, ':')))-1 


STRINGS ID 
entry: ::flanders: 

entry: ::flanders: 

entry: ::flanders: 
entry:moe::sizlack: 
entry:moe::sizlack: 
entry:moe::sizlack: 
entry:petergriffin:meg:chris: 
entry:petergriffin:meg:chris: 
entry:petergriffin:meg:chris: 
entry:quagmire:mayorwest:cleveland: 
entry:quagmire:mayorwest:cleveland: 
entry:quagmire:mayorwest:cleveland: 
entry:robo:tchi:ken: 
entry:robo:tchi:ken: 
entry:robo:tchi:ken: 
entry:stewiegriffin:lois:brian: 
entry:stewiegriffin:lois:brian: 
entry:stewiegriffin:lois:brian: 
entry:willie: 


e NN) OU HB UJ) N P NJ QQ HL N UJ P QQ N F Q N HF 





下 一 步 是 调用 INSTR 函数 找 出 每 个 字符 串 里 每 个 冒号 的 位 置 。 因 为 我 们 要 提取 的 每 个 值 





都 被 两 个 冒号 包围 ， 这 两 个 冒号 的 位 置信 息 分 别 命名 为 Pl1 和 P2， 意 思 是 
“位 置 2”?。 


with cartesian as ( 
select level id 
from dual 
connect by level <= 100 
) 
select v.strings, 
c.id, 
instr(v.strings,':',1,c.id) p1, 
instr(v.strings,':',1,c.id41)-instr(v.strings,':',1,c.id) p2 
from v,cartesian c 
where c.id <= (length(v.strings)-length(replace(v.strings, ':')))-1 








order by 1 
STRINGS ID P1 P2 
entry: ::flanders: 1 6 1 





注 2: 严格 来 讲 ，P2 是 两 个 冒号 之 间 的 距离 ， 而 不 是 右 侧 冒号 的 索引 位 置 。 一 一 译 者 注 

















“位 置 1” 和 
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entry:::flanders: 2 7 1 
entry:::flanders: 3 8 9 
entry:moe::sizlack: 1 6 4 
entry:moe::sizlack: 2 10 1 
entry:moe::sizlack: 3 11 8 
entry:petergriffin:meg:chris: 1 6 13 
entry:petergriffin:meg:chris: 3 23 6 
entry:petergriffin:meg:chris: 2 19 4 
entry:quagmire:mayorwest:cleveland: 1 6 9 
entry:quagmire:mayorwest:cleveland: 3 25 10 
entry:quagmire:mayorwest:cleveland: 2 15 10 
entry:robo:tchi:ken: 1 6 5 
entry:robo:tchi:ken: 2 11 5 
entry:robo:tchi:ken: 3 16 4 
entry:stewiegriffin:lois:brian: 1 6 14 
entry:stewiegriffin:lois:brian: 3 25 6 
entry:stewiegriffin:lois:brian: 2 20 5 
entry:willie: 1 6 7 

















现在 我 们 已 经 知道 了 每 个 字符 串 里 每 对 冒号 的 位 置信 息 ， 剩 下 要 做 的 就 是 把 这 些 信息 传递 
给 SUBSTR 国 数 以 提取 出 目标 值 。 我 们 想 要 创建 一 个 3 列 的 结果 集 ， 因 此 需要 调用 DECODE 
函数 评估 上 述 第 卡 儿 积 里 的 ID, 


with cartesian as ( 
select level id 
from dual 
connect by level <= 100 
) 
select decode(id,1,substr(strings,p1+1,p2-1)) vall, 
decode(id,2,substr(strings,p1+1,p2-1)) val2, 
decode(id,3,substr(strings,p1+1,p2-1)) val3 
from ( 
select v.strings, 
c. id, 
instr(v.strings,':',1,c.id) p1, 
instr(v.strings, ':',1,c.id41)-instr(v.strings,':',1,c.id) p2 
from v,cartesian c 
where c.id <= (length(v.strings)-length(replace(v.strings, ':')))-1 

















) 
order by 1 

VAL1 VAL2 VAL3 

moe 

petergriffin 

quagmire 

robo 

stewiegriffin 

willie 
lois 
meg 
mayorwest 
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tchi 
brian 
sizlack 
chris 
Cleveland 
flanders 
ken 


最 后 ， 基 于 STRINGS 分 组 并 针对 SUBSTR 的 返回 值 调用 聚合 函数 以 生成 更 有 可 读 性 的 结果 和 集 。 


with cartesian as ( 
select level id 
from dual 
connect by level «- 100 
) 
select max(decode(id,1,substr(strings,p1*1,p2-1))) vall, 
max(decode(id,2,substr(strings,p14*1,p2-1))) val2, 
max(decode(id,3,substr(strings,p14*1,p2-1))) val3 
from ( 
select v.strings, 
c.id, 
instr(v.strings,':',1,c.id) p1, 
instr(v.strings,':',1,c.id«1)-instr(v.strings,':',1,c.id) p2 
from v,cartesian c 
where c.id <= (length(v.strings)-length(replace(v.strings, ':')))-1 














) 
group by strings 
order by 1 
VAL1 VAL2 VAL3 
moe sizlack 
petergriffin meg chris 
quagmire mayorwest Cleveland 
robo tchi ken 
stewiegriffin lois brian 


willie 
flanders 


14.42 ”计算 比重 


1. 问题 

报表 中 有 一 组 数字 值 ， 你 想 同 时 显示 每 个 值 占 总 数 的 百分比 。 例 如 ， 你 使 用 的 是 Oracle 数 
据 库 ， 你 希望 返回 一 个 按照 JoB 维度 计算 出 来 的 工资 分 布 情况 ， 这 样 就 能 判断 出 哪些 JOB 
耗费 了 公司 最 多 的 钱 。 ee 
中 出 现 的 百分比 产生 误导 。 你 希望 得 到 如 下 所 示 的 报表 。 




















JOB NUM_EMPS PCT_OF_ALL_SALARIES 
CLERK 4 14 
ANALYST 2 20 





MANAGER 3 28 
SALESMAN 4 19 
PRESIDENT 1 17 


如 上 所 述 ， 如 果 报 表 中 没有 包含 员工 人 数 ， 看 起 来 似乎 总 经 理 的 工资 比例 并 不 高 。 加 入 员 
工人 数 后 ， 我 们 才 清 楚 地 看 到 总 经 理 一 个 人 的 工资 竟然 占 了 总 数 的 17%。 

2. 解决 方案 

对 于 本 问题 而 言 ， 只 有 Oracle 提供 了 一 个 合适 的 解决 方案 ， 因 为 Oracle 支持 内 置 函数 
RATIO_TO_REPORT。 对 于 其 他 数据 库 ， 为 了 计算 比重 ， 不 妨 使 用 除法 ， 请 参考 7.11 节 。 















































1 select job,num emps,sum(round(pct)) pct of all salaries 
2 from ( 

3 select job, 

4 count(*)over(partition by job) num emps, 

5 ratio to report(sal)over()*100 pct 
6 from emp 
7 ) 
8 


group by job,num emps 
3. 讨论 
首先 使 用 窗口 函数 COUNT. OVER 计算 每 个 J08 对 应 的 员工 人 数 。 然 后 使 用 RATIO, TO REPORT 
计算 每 个 员工 的 工资 占 总 数 的 百分比 (该 值 以 小 数 形式 返回 )。 
select job, 


count(*)over(partition by job) num emps, 
ratio to report(sal)over()*100 pct 




















from emp 
JOB NUM EMPS PCT 
ANALYST 2 10.3359173 
ANALYST 2 10.3359173 
CLERK 4 2.75624462 
CLERK 4 3.78983635 
CLERK 4 4.4788975 
CLERK 4 3.27304048 
MANAGER 3 10.2497847 
MANAGER 3 8.44099914 
MANAGER 3 9.81912145 
PRESIDENT 1 17.2265289 
SALESMAN 4 5.51248923 
SALESMAN 4 4.30663221 
SALESMAN 4 5.16795866 
SALESMAN 4 4.30663221 





最 后 ， 使 用 聚合 函数 SUM 计算 RATIO TO REPORT 函数 的 返回 值 的 合计 值 。 不 要 忘记 根据 208 
和 NUM EMPS 分 组 。 另 外 ， 要 乘 以 100 才能 得 到 一 个 代表 百分比 的 整数 (例如 ， 对 于 25% 
来 说 ， 应 该 返回 的 是 25 而 不 是 0.25) : 

select job,num emps,sum(round(pct)) pct, of all salaries 


from ( 
select job, 




















cou 
rat 
from emp 


) 
group by 


SALESMAN 
PRESIDENT 


nt(*)over(partition by job) num emps, 
io to report(sal)over()*100 pct 
job,num emps 


NUM EMPS PCT OF ALL SALARIES 


14.13 ”从 Oracle 中 生成 CSV 格 式 的 输出 


1. 问题 
你 想 把 一 个 表 旺 








的 数据 转换 成 某 种 分 隔 列 表 形 式 〈 例 如 ， 以 逗号 作为 分 隔 符 )。 例 如 ， 对 


于 EMP 表 ， 你 希望 得 到 如 下 所 示 的 结果 集 。 


DEPTNO LIS 
10 MIL 
20 FOR 
30 JAM 


T 
LER,KING,CLARK 

D , ADAMS , SCOTT , JONES , SMITH 

ES, TURNER, BLAKE , MARTIN ,NARD , ALLEN 














假设 你 正在 使 用 Oracle 数据 库 (Oracle Database 10g 或 后 续 的 版 本 ) ， 并 希望 借助 MODEL F 
句 实现 本 问题 的 解决 方案 。 


2. 解决 方案 











本 解决 方案 利用 了 Oracle 的 MODEL 子 名 提供 的 选 代 功能 。 这 里 用 到 的 技巧 是 ， 使 用 窗口 函 
数 ROW. NUMBER OVER 对 每 个 DEPTNO 对 应 的 员工 进行 编号 (按照 EMPNO 排序 ， 不 过 按照 哪个 
字段 排序 并 不 重要 )。 因 为 MODEL 支持 以 数组 形式 访问 行 值 ， 我 们 可 以 通过 把 序号 减 1 实现 
对 前 一 个 数组 元 素 的 访问 。 因 此 ， 对 于 每 一 行 ， 我 们 要 创建 一 个 列表 ， 该 列表 包含 了 当前 





员工 的 名 字 ， H 


























F 加 上 编号 小 于 当前 员工 的 那些 人 的 名 字 。 





1 select deptno, 

2 list 

3 from ( 

4 select * 

5 from ( 

6 select deptno,empno,ename, 

7 lag(deptno)over(partition by deptno 

8 order by empno) prior_deptno 
9 from emp 

10 ) 

11 model 

12 dimension by 

13 ( 

14 deptno, 

15 row number()over(partition by deptno order by empno) rn 





16 ) 


17 measures 
18 ( 
19 ename, 
20 prior deptno,cast(null as varchar2(60)) list, 
21 count(*)over(partition by deptno) cnt, 
22 row number(J)over(partition by deptno order by empno) rnk 
23 ) 
24 rules 
25 ( 
26 list[any,any] 
27 order by deptno,rn = case when prior deptno[cv(),cv()] is null 
28 then ename[cv( ),cv( )] 
29 else ename[cv( ),cv( )]|1|','|| 
30 list[cv(),rnk[cv( ),cv( )]-1] 
31 end 
32 ) 
33 ) 
34 where cnt = rn 
3. 讨论 





首先 使 用 窗口 函数 LAG OVER 读 取 前 一 个 员工 (按照 EMPNO 排序 ) 的 DEPTN0。 结 果 按 照 
DEPTNO 分 区 ， 因 此 对 于 每 个 部 门 的 第 一 个 员工 (按照 EMPNO 排序 ) 返回 值 将 是 Null, XT 
其 余 员 工 而 言 ， 返 回 值 则 是 本 部 门 的 DEPTN0。 结 果 集 如 下 所 示 。 

select deptno,empno ,ename， 


lag(deptno)over(partition by deptno 
order by empno) prior, deptno 








from emp 

DEPTNO EMPNO ENAME PRIOR DEPTNO 
10 7782 CLARK 
10 7839 KING 10 
10 7934 MILLER 10 
20 7369 SMITH 
20 7566 JONES 20 
20 7788 SCOTT 20 
20 7876 ADAMS 20 
20 7902 FORD 20 
30 7499 ALLEN 
30 7521 WARD 30 
30 7654 MARTIN 30 
30 7698 BLAKE 30 
30 7844 TURNER 30 
30 7900 JAMES 30 





下 一 步 仔 细 观 察 MODEL 子 句 的 MEASURES 377 , MEASURES 列表 里 的 项 目 是 如 下 的 几 个 数组 。 


° ENAME; 一 个 包含 EM 表 里 全 部 ENAME 值 的 数组 。 

° PRIOR_DEPTNO， 由 窗口 国 数 LAG OVER 返回 值 构成 的 数组 。 

。 CNT; 由 每 个 DEPTNO 对 应 的 员工 人 数 构成 的 数组 。 

e RNK; 每 个 DEPTNO 分 组 内 每 个 员工 的 编号 (按照 EMPNO HEF) 构成 的 数组 。 














数组 索引 是 DEPTNO 和 RN (在 DIMENSION BY 子 句 里 调用 窗口 国 数 ROW. NUMBER OVER 得 到 的 返 
回 值 )。 如 果 希 望 看 到 上 述 这些 数 组 里 实际 包含 了 哪些 值 ， 只 要 注释 掉 MODEL 子 句 的 RULES 
部 分 代码 并 执行 查询 即 可 ， 如 下 所 示 。 


select * 
from ( 
select deptno,empno,ename, 
lag(deptno)over(partition by deptno 
order by empno) prior_deptno 














from emp 
) 
model 
dimension by 
( 
deptno, 
row_number()over(partition by deptno order by empno) rn 
) 
measures 
( 
ename, 
prior deptno,cast(null as varchar2(60)) list, 
count(*)over(partition by deptno) cnt, 
row number()over(partition by deptno order by empno) rnk 


) 
rules 
( 
/* 
list[any,any] 
order by deptno,rn = case when prior deptno[cv(),cv()] is null 
then ename[cv(),cv()] 
else enane[cv(),cvO]I lI '; ' ILI 
List[cv() , rnk[cv(C ),cv(C 21-1] 
end 
*/ 
) 
order by 1 
DEPTNO RN ENAME PRIOR DEPTNO LIST CNT RNK 
10 1 CLARK 3 1 
10 2 KING 10 3 2 
10 3 MILLER 10 3 3 
20 1 SMITH 5 1 
20 2 JONES 20 5 2 
20 4 ADAMS 20 5 4 
20 5 FORD 20 5 5 
20 3 SCOTT 20 5 3 
30 1 ALLEN 6 1 
30 6 JAMES 30 6 6 
30 4 BLAKE 30 6 4 
30 3 MARTIN 30 6 3 
30 5 TURNER 30 6 5 
30 2 WARD 30 6 2 
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MERN 25 MODEL 子 句 里 声明 的 那些 项 目 了 ， 接 下 来 看 一 下 RULES 部 分 的 代码 。CASE 
表达 式 负 责 评估 PRIOR DEPTNO 的 当前 值 。 如 果 当 前 值 是 NtL， 表 明 它 是 每 个 DEPTN0 分 组 
内 的 第 一 个 员工 ， 那 么 该 员工 的 ENAME 会 被 作为 当前 员工 的 LIST。 如 果 PRIOR DEPTNO 值 不 
是 NtL， 那 么 就 把 前 一 个 员工 的 LIST 值 附加 上 当前 员工 的 名 字 (ENAME 数组 ) ， 然 后 把 结 
果 作 为 当前 员工 的 LIST。 针 对 DEPTNO 分 组 内 的 每 一 行 记录 执行 该 CASE 表达 式 操 作 的 话 ， 
就 会 得 到 一 个 迭代 的 、 过 号 分 隔 的 值 列表 (HH csv 格式 的 输出 )。 如 下 所 示 的 例子 里 打印 
出 了 中 间 结 果 。 


select deptno, 
list 
from ( 
select * 
from ( 
select deptno,empno,ename, 
lag(deptno)over(partition by deptno 
order by empno) prior, deptno 






































from emp 
) 
model 
dimension by 
( 
deptno, 
row number()over(partition by deptno order by empno) rn 
) 
measures 
( 
ename, 
prior deptno,cast(null as varchar2(60)) list, 
count(*)over(partition by deptno) cnt, 
row number()over(partition by deptno order by empno) rnk 
) 
rules 
( 
list[any,any] 
order by deptno,rn = case when prior deptno[cv(),cv()] is null 
then enamne[cv(),cv()] 
else enane[cv(),cvO]I I '; ' HI 
list[cv(), rnk[cv( ),cv( )1-1] 
end 
) 
) 


DEPTNO LIST 
10 CLARK 
10 KING,CLARK 
10 MILLER,KING,CLARK 
20 SMITH 
20 JONES,SMITH 
20 SCOTT, JONES , SMITH 
20 ADAMS , SCOTT , JONES , SMITH 
20 FORD,ADAMS , SCOTT , JONES , SMITH 
30 ALLEN 





30 WARD,ALLEN 

30 MARTIN,WARD,ALLEN 

30 BLAKE,MARTIN,WARD,ALLEN 

30 TURNER,BLAKE,MARTIN,WARD,ALLEN 

30 JAMES,TURNER,BLAKE,MARTIN,WARD,ALLEN 


最 后 要 过 滤 掉 其 他 员工 ， 只 保留 每 个 DEPTN0 分 组 内 的 最 后 一 个 员工 ， 这 样 才能 确保 每 个 





DEPTNO 都 能 得 到 一 个 完整 的 CSV 列表 。 保 存在 CNT 和 RN 数组 里 的 值 能 实现 这 一 
表 每 个 DEPTN0 分 组 内 按照 EMPN0 排序 后 得 到 的 员工 编号 ， 因 此 每 个 DEPTNO 474 
个 员工 就 是 满足 CNT = RN 条 件 的 那个 员工 ， 如 下 所 示 。 


select deptno, 
list 
from ( 
select * 
from ( 
select deptno,empno,ename, 
lag(deptno)over(partition by deptno 
order by empno) prior deptno 











from emp 
) 
model 
dimension by 
( 
deptno, 
row number()over(partition by deptno order by empno) rn 
) 
measures 
( 
ename, 
prior  deptno,cast(null as varchar2(60)) list, 
count(*)over(partition by deptno) cnt, 
row number()over(partition by deptno order by empno) rnk 
) 
rules 
( 
list[any,any] 
order by deptno,rn - case when prior deptno[cv(),cv()] is null 
then ename[cv(),cv()] 
else enane[cv(),cvO]I I"; ' ILI 
list[cvO , rnk[cv(C ),cv(C 21-1] 
end 
) 
) 


where cnt = rn 


DEPTNO LIST 
10 MILLER,KING,CLARK 
20 FORD,ADAMS , SCOTT , JONES , SMITH 
30 JAMES,TURNER, BLAKE , MARTIN , WARD , ALLEN 


点 。 
组 内 最 


pi 
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14.44 ” 找 出 不 匹配 某 个 格式 的 文本 


1. 问题 
你 有 一 个 文本 字段 ， 其 中 包含 了 一 些 格式 化 过 的 字符 串 (例如 电话 号 码 )， 你 希望 找 出 那 
些 不 符合 格式 要 求 的 值 。 例 如 ， 你 的 数据 如 下 所 示 。 


select emp id, text 
from employee comment 





7369 126 Varnum, Edmore MI 48829, 989 313-5351 


7499 1105 McConnell Court 
Cedar Lake MI 48812 
Home: 989-387-4321 
Cell: (237) 438-3333 


你 希望 把 电话 号 码 格式 不 正确 的 那些 行 都 找 出 来 。 举 例 而 言 ， 查 询 结果 应 该 包括 下 面 这 行 
数据 ， 因 为 其 中 包含 的 那个 电话 号 码 同时 使 用 了 两 种 不 同 的 分 隔 符 。 











7369 126 Varnum，Edmore MI 48829，989 313-5351 
你 认为 一 个 电话 号 码 里 包含 的 两 个 分 隔 符 应 该 使 用 同样 的 符号 。 
2. 解决 方案 


本 问题 的 解决 方案 包含 多 个 步 又。 


(1) 设法 定义 何 种 形式 的 数据 应 该 被 认为 “看 起 来 像 电话 号 码 。 

(2) 删除 格式 正确 的 电话 号 码 。 

(3) 查看 是 否 还 剩 下 任何 看 起 来 像 电话 号 码 的 数据 。 如 果 是 ， 剩 下 的 那些 就 是 格式 不 正确 
的 电话 号 码 。 


下 面 的 解决 方案 充分 利用 了 Oracle Database 10g 提供 的 正则 表达 式 功 能 。 


select emp_id, text 
from employee_comment 
where regexp like(text, '[0-9]{3}[-. ][0-9]{3}[-. 1[0-9](4]') 
and regexp, like( 
regexp, replace(text, 
'[0-9]{3}([-. ])[0-9](3)NVi1[0-9](4y','***'), 
'[0-9]{3}[-. ][0-9]1(3)[-. 1[0-91(43') 























7 














EMP_ID TEXT 


7369 126 Varnum, Edmore MI 48829, 989 313-5351 
7844 989-387.5359 
9999 906-387-1698, 313-535.8886 


上 面 的 每 一 行 查询 结果 里 都 至 少 包含 了 一 个 看 起 来 像 电话 号 码 而 格式 却 不 符合 要 求 的 值 。 
































3. 讨论 

本 解决 方案 的 关键 在 于 找 出 那些 看 起 来 像 电话 号 码 的 数据 。 由 于 电话 号 码 作为 某 个 文本 字 
段 的 一 部 分 而 存在 ， 该 字段 包含 的 任何 文本 都 可 能 是 符合 要 求 的 电话 号 码 。 我 们 需要 设法 
缩小 搜寻 范围 ， 过 滤 掉 那些 明显 不 符合 要 求 的 数据 。 例 如 ， 我 们 不 希望 在 查询 结果 中 看 到 
类 似 下 面 的 数据 。 


EMP_ID TEXT 
































7900 Cares for 100-year-old aunt during the day. Schedule only 
for evening and night shifts. 


显然 上 述 数据 记录 中 根本 不 存在 类 似 电 话 号 码 的 内 容 ， 更 别提 格式 是 否 有 效 了 。 每 个 人 都 
能 看 明白 这 一 点 。 问 题 是 ， 我 们 应 该 如 何 让 关系 数据 库 管 理 系统 也 能 “明白 ”这 一 点 。 相 
信 你 都 希望 知道 具体 的 做 法 。 请 继续 读 下 去 吧 。 








本 实例 源 自 Jonathan Gennick 的 一 篇 文章 “Regular Expression Anti-Patterns” 
Wa. (已 经 取得 作者 授权 )。 


rss 








本 解决 方案 使 用 下 述 Pattern A 定义 看 起 来 像 电话 号 码 的 数据 。 
Pattern A: [0-9](3)[-. ][0-9](3)[-. J][0-9]{4} 


上 述 Pattern A 规 定 了 电话 号 码 开 头 须 包 含 两 组 3 位 长 度 的 数字 ， 然 后 须 跟着 一 组 4 位 长 
度 的 数字 。 两 组 之 间 的 分 隔 符 可 以 是 英文 破 折 号 (-)、 句 号 (.) 或 空格 。 当 然 ， 此 处 我 
们 也 能 写 出 一 个 更 复杂 的 正则 表达 式 。 例 如 ， 可 以 考虑 允许 出 现 7 位 长 度 的 电话 号 码 。 不 
过 ， 我 们 没 必要 偏离 主题 太 远 。 现 在 的 重点 是 设法 定义 何 种 形式 的 数据 应 该 被 认为 “看 起 
来 像 电 话 号 码 ”， 并 且 对 于 本 问题 而 言 ，Pattern A 已 经 能 够 满足 要 求 了 。 我 们 也 可 以 写 一 
个 不 同 的 正则 表达 式 ， 不 过 它 和 Pattern A 应 该 差别 不 大 。 
本 解决 方案 的 WHERE 子 句 使 用 Pattern A 确保 只 有 那些 可 能 包含 电话 号 码 (必须 符合 上 述 
正则 表达 式 ! ) TT AUR XE HARE e 

select emp_id, text 

from employee_comment 

where regexp_like(text, '[0-9]{3}[-. ][0-9](3)[-. 1[0-9](4]') 
接 下 来 ， 我 们 需要 考虑 如 何 定义 一 个 “格式 良好 的 ”电话 号 码 。 本 解决 方案 使 用 Pattern B 
实现 该 操作 。 

Pattern B: [0-9](3)([-. 1)[0-9]{3}\1[0-9]{4} 
上 述 正则 表达 式 里 ，\1 指 代 第 一 个 子 表达 式 ([-. ])。 必 须 和 \1 匹 配 到 同样 的 分 隔 符 。 
Pattern B 定义 了 何 为 格式 良好 的 电话 号 码 ， 这 些 电 话 号 码 会 被 排除 掉 (因为 它们 的 格式 符 
合 要 求 )。 本 解决 方案 借助 REGEXP_REPLACE 函数 来 排除 掉 这 些 格 式 良好 的 电话 号 码 。 


regexp_replace(text, 


'[0-9](3)([-. DI0-9]()M[0-9](4) ,' 8*9"), 
上 述 REGEXP. REPLACE 函数 调用 出 现在 WHERE 子 句 里 。 任 何 格式 良好 的 电话 号 码 都 会 被 三 个 
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连续 的 星 号 字符 替换 掉 。 同 样 ，Pattern B 也 不 是 一 定 要 写成 上 述 形 式 ， 只 要 它 能 筛选 出 符 
合 要 求 的 电话 号 码 即 可 。 


我 们 已 经 用 三 个 连续 的 星 号 “***” 替 换 掉 了 格式 良好 的 电话 号 码 ， 剩 下 的 自然 就 是 那些 
“看 起 来 像 电 话 号 码 ” 但 又 不 符合 格式 定义 的 电话 号 码 了 。 接 着 针对 REGEXP_REPLACE 函数 
的 返回 值 调 用 REGEXP_LIKE 函数 ， 这 样 就 能 筛选 出 不 符合 格式 要 求 的 电话 号 码 。 
and regexp_like( 
regexp_replace(text, 
'[0-9](3)([-. J)[0-9](3)JN4[0-9](4)','***'), 

'[0-9]{3}[-. ][0-9](3)[-. ][9-9]{4} 7) 
Oracle 的 正则 表达 式 提 供 了 文本 模式 匹配 能 力 ， 没 有 该 功能 的 话 ， 本 实例 恐怕 难以 找到 合 
适 的 解决 方案 。 特 别 需 要 指出 的 是 ， 本 实例 非常 依赖 REGEXP_REPLACE 函数 。 其 他 数据 库 
(例如 PostgreSQL) 也 支持 正则 表达 式 。 但 据 我 所 知 ， 只 有 Oracle 同时 支持 正则 表达 式 匹 
配 和 替换 功能 。 


14.15 (AARM EH RAE 


1. 问题 
你 有 一 个 表 ， 其 中 一 列 存放 的 数据 有 时 是 数字 ， 有 时 是 字符 。 有 具体 存放 了 什么 类 型 的 数据 
记录 在 同一 张 表 的 另外 一 列 里 。 你 希望 使 用 一 个 子 查 询 把 数字 类 型 的 数据 都 提取 出 来 。 
select * 
from ( select flag, to number(num) num 

from subtest 

where flag in ('A', 'C') ) 

where num > 0 
Au. EXRPNIBCHLER 45 g 36 %6 35 [LAC Brz RH EE. (但 并 非 总 是 报错 )。 


ERROR: 
ORA-01722: invalid number 


2. 解决 方案 
一 种 办 法 是 强制 要 求 内 租 视 图 先 于 外 层 SELECT 语 名 执行。 至少 在 Oracle 中 可 以 这 样 做 ， 
具体 做 法 是 为 内 层 的 SELECT 列表 加 上 伪 列 ROWNUM。 


select * 
from ( select rownum, flag, to number(num) num 

from subtest 

where flag in ('A', 'C') ) 

where num » 0 
我 们 会 在 下 面 的 “讨论 ”部 分 具体 解释 该 解决 方案 的 原理 。 
3. 讨论 
之 所 以 出 现 上 述 错误 是 因为 有 时 候 优 化 器 会 合并 内 层 和 外 层 查 询 。 尽 管 乍 一 看 去 似乎 应 该 
先 执行 内 层 查询 ， 然 后 再 剔除 掉 非 数字 NUM 值 ， 但 实际 上 真正 执行 的 可 能 是 下 面 的 查询 。 































































































select flag, to_number(num) num 


from subtest 


where to_number(num) > 0 and flag in ('A', 'C'); 


现在 我 们 就 能 清楚 


行 并 没有 被 预先 排除 掉 。 


oa 
` 








数据 库 系 统 应 该 合并 子 查 询 和 主 查 询 吗 ?答案 取决 于 我 们 考虑 问题 的 角度 。 
。， 应 该 依据 关系 理论 考虑 这 个 问题 ， 
”依据 某 个 数据 库 的 具体 实现 方式 来 考虑 这 个 问题 ? 








地 看 到 出 








还 是 把 遵从 SQL 标准 放 在 第 





一 位 ? 或 者 


错 的 原因 了 : 调用 TO NUMBER 国 数 之 前 ， 含 有 非 数字 NUM 值 的 


本 解决 方案 向 内 层 a Meu O m 来 本 问题 至 少 在 Oracle 范围 


内 得 到 了 人 解决。ROWNUM 是 一 个 函数 ， 它 
被 称 为 行 号 (row ee 


顺序 递增 的 值 ， 








计算 出 行 号 。 








执行 主 查 询 之 
询 和 主 查询 )。 


14.16 
1. 问题 





create view V 


as 


























会 为 每 一 行 查询 结果 返回 一 个 顺序 递增 的 值 。 这 








xte 





如 果 脱 离 了 具体 的 查询 上 下 文 ，Oracle 就 无 法 
因此 ，Oracle 必须 先 执 行 子 查 询 并 实体 化 其 结果 集 ， 这 样 才能 为 每 一 行 查询 
结果 计算 出 正确 的 行 号 。 也 因 


为 这 个 原因 ， 调 用 ROWNUM 函数 其 实 就 是 一 种 强迫 Oracle 在 





前 先 完整 执行 子 查询 的 技巧 (也 就 是 说 ， 这 种 状况 下 Oracle 不 允许 合并 子 查 


如 果 你 希望 在 其 他 数据 库 上 也 这 么 做 ， 不 妨 研究 一 下 具体 的 数据 库 是 否 有 
类 似 Oracle 的 ROWNUM 这 样 的 功能 。 


测试 一 组 数据 中 是 否 存 在 某 个 值 


1 行 记录 里 是 否 包 含 某 个 特定 值 来 生成 一 个 布尔 值 。 试 想 这 样 一 个 例子 ， 一 

学 生 在 一 段 时 间 人 假设 他 每 3 个 月 会 参加 3 场 考试 。 
Ue 场 ， 将 返回 一 个 标志 (flag) 以 表示 考试 通过 。 如 果 3 场 都 没有 通过 ， 也 会 返 
个 标志 以 表示 考试 未 通过 。 我 们 看 一 下 下 面 的 例子 。( 这 里 使 用 
例 数据 ， 对 于 DB2 和 SQL Server， 了 略微 调整 即 可 ， 因 为 它们 也 支持 窗口 函数 。) 


select 1 student_id, 
1 test id, 
2 grade id, 


1 period id, 

















to date('02/01/2005' , 'MM/DD/YYYY') test date, 


0 pass fail 


from dual union all 
i date('03/01/2005', 'MM/DD/YYYY'), 1 from 
o date('04/01/2005', 'MM/DD/YYYY'), © from 
o date('05/01/2005','MM/DD/YYYY'), © from 
o date('06/01/2005','MM/DD/YYYY'), © from 
o date('07/01/2005' , 'MM/DD/YYYY'), © from 


select 1, 


select 
select 
select 
select 


select * 
from V 


1 
1, 
1, 
1 


2, 


25 


2 
2, 
2 
2 


1; 
2, 
» 25 
2, 


1, 


dual union 
dual union 
dual union 
dual union 
dual 





all 
all 
all 
all 
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STUDENT ID TEST ID GRADE ID PERIOD ID TEST DATE . PASS FAIL 


仔细 观察 以 上 结果 集 ， 可 以 看 到 这 个 学 生 在 两 个 学 期 里 共 参 加 了 6 5X. fult r3 
通过 ”，0 表示 “未 通过 ”)， 因 此 他 第 一 个 学 期 的 学 习 成 绩 算是 过 关 了 。 他 


一 场 ( 
在 第 二 





1 表示 “ 


1 01-FEB-2005 0 
1 01-MAR-2005 1 
1 01-APR-2005 0 
2 01-MAY-2005 0 
2 01-JUN-2005 0 
2 01-JUL-2005 0 


























其 中 


个 学 期 〈 接 下 来 的 3 个 月 ) 没有 通过 任何 一 场 考 试 ， 因 此 3 场 考 试 的 PASS. FAIL 列 





都 是 0。 你 希望 返回 








如 下 所 示 的 结果 集 。 


STUDENT_ID TEST_ID GRADE_ID PERIOD_ID TEST_DATE METREQ IN_PROGRESS 
1 2 1 01-FEB-2005 + 
2 2 1 01-MAR-2005 + 
3 2 1 01-APR-2005 + 
4 2 2 01-MAY-2005 
5 2 2 01-JUN-2005 
6 2 2 01-JUL-2005 





一 个 结果 集 表 示 这 个 学 生 某 个 学 期 是 否 通过 了 考试 。 最 终 你 希望 得 到 


METREQ 〈 表 示 是 否 通过 ) 的 值 是 “+” 和 “-”， 表 示 学 生 在 一 个 学 期 (3 个 月 ) 内 是 否 通 
过 了 至 少 一 场 考 试 。 如 果 一 个 学 生 在 一 个 学 期 内 通过 了 至 少 一 场 邦 试 ， 则 IN PROGRESS 


值 为 0。 如 果 没 有 通过 任何 一 场 考 试 ， 那 么 他 参加 的 最 后 一 场 考试 对 应 的 IN, PROGRESS [ë 


应 该 是 


2. 解决 


本 问题 比较 麻烦 的 地 方 是 ， 我 们 必须 把 同一 组 的 行 看 作 一 个 整体 ， 而 非 互 相 独 立 的 个 
先 看 一 下 “问题 ”部 分 给 出 的 PASS_FAIL 值 。 如 果 我 们 逐 行 做 判断 ， 则 除了 TEST ID 2, 
的 METREQ 值 都 是 “-”。 但 事实 并 非 如 此 。 我 们 必须 基于 一 组 行 记录 做 


AL 


余 每 行 


1, 


方案 





TIT 





























x > 














判断 。 借 助 


窗口 函数 MAX OVER， 很 容易 确认 一 个 学 生 在 一 个 学 期 内 是 否 通过 了 至 少 一 场 考试 。 一 旦 擎 
握 了 这 样 的 信息 ， 布 尔 值 计 算 就 变 成 了 简单 的 CASE 表达 式 问 题 。 


1 
2 
3 
4 
5 
6 
7 
8 


select 


from 
select 


from 








student id, 
test id, 
grade id, 
period id, 
test date, 
decode( grp p f,1,lpad('*',6),lpad('-',6) ) metreq, 
decode( grp p f,1,0, 
decode( test date,last test,1,0 ) ) in progress 

( 
Mut 
max(pass fail)over(partition by 

student id,grade id,period id) grp p f, 
max(test date)over(partition by 

student id,grade id,period id) last test 
V 
)x 





3. 讨论 

本 解决 方案 的 关键 在 于 使 用 窗口 函数 MAX OVER 为 每 个 分 组 返回 最 大 的 PASS_FAIL 值 。 因 为 

PASS FAIL 值 只 能 是 1 或 0， 那 么 只 要 学 生 通 过 了 至 少 一 场 考 试 ， 则 MAX OVER 就 会 返回 1。 

下 面 展 示 了 具体 的 查询 结果 。 
select V.*, 


max(pass fail)over(partition by 
student id,grade id,period id) grp pass fail 












































from V 


STUDENT ID TEST ID GRADE ID PERIOD ID TEST DATE . PASS FAIL GRP PASS FAIL 
1 01-FEB-2005 0 1 
1 01-MAR-2005 1 1 
1 01-APR-2005 0 1 
2 01-MAY-2005 0 0 
2 01-JUN-2005 0 0 
2 01-JUL-2005 0 0 


以 上 结果 集 显 示 该 学 生 在 第 一 个 学 期 通过 了 至 少 一 场 考试 ， 因 此 第 一 个 学 期 对 应 的 GRP_ 
PASS_FAIL 值 都 被 设置 成 了 1。 除 此 之 外 ， 如 果 学 生 在 一 个 学 期 内 没有 通过 任何 一 场 考试 ， 
那么 该 学 期 最 后 一 场 考 试 对 应 的 IN_PROGRESS 值 应 该 被 设置 为 1。 我 们 也 可 以 使 用 窗口 函 
数 MAX OVER 来 实现 这 一 要 求 。 
select V.*, 
max(pass fail)over(partition by 
student id,grade id,period id) grp p f, 


max(test date)over(partition by 
student id,grade id,period id) last test 











from V 


STUDENT ID TEST ID GRADE ID PERIOD ID TEST DATE . PASS FAIL GRP P F LAST TEST 


1 1 2 1 01-FEB-2005 0 1 01-APR-2005 
1 2 2 1 01-MAR-2005 1 1 01-APR-2005 
1 3 2 1 01-APR-2005 0 1 01-APR-2005 
1 4 2 2 01-MAY-2005 0 0 01-JUL-2005 
1 5 2 2 01-JUN-2005 0 0 01-JUL-2005 
1 6 2 2 01-JUL-2005 0 0 01-JUL-2005 


现在 ， 我 们 已 经 计算 出 了 这 名 学 生 通 过 了 哪个 学 期 的 考试 以 及 每 个 学 期 最 后 一 场 考试 的 日 
期 最 后 只 要 格式 化 结果 集 即 可 。 使 用 Oracle 的 DECODE 函数 (功能 类 似 CASE 表达 式 ) iF 
算出 最 终 的 METREQ 和 IN PROGRESS 列 。 使 用 LPAD 函数 确保 计算 出 来 的 METREQ 值 右 对齐 。 


select student id, 
test id, 
grade id, 
period id, 
test date, 
decode( grp p f,1,lpad('*',6),lpad('-',6) ) metreq, 
decode( grp p f,1,0, 
decode( test date,last test,1,0 ) ) in progress 








from ( 





select V.*, 
max(pass fail)over(partition by 
student id,grade id,period id) grp p f, 
max(test date)over(partition by 
student id,grade id,period id) last test 
from V 
)x 


STUDENT ID TEST ID GRADE ID PERIOD ID TEST DATE METREQ IN PROGRESS 
1 01-FEB-2005 * 
1 01-MAR-2005 * 
1 01-APR-2005 * 
2 01-MAY-2005 x 
2 01-JUN-2005 i 
2 01-JUL-2005 - 








本 书 的 很 多 实例 都 使 用 了 ISO SQL 标准 2003 新 增 的 窗口 国 数 功 能 ， 也 充分 利用 了 各 种 数 
据 库 的 专 有 窗口 函数 。 本 附录 将 简要 介绍 窗口 函数 的 工作 原理 。 总 体 而 言 ， 窗 口 函数 的 出 
现 使 得 许多 通常 被 认为 非常 辐 手 的 任务 变 得 较为 容易 了 (我 指 的 是 那些 单纯 使 用 标准 SQL 
难以 解决 的 问题 )。 除 了 阅读 本 章 的 内 容 ， 你 还 可 以 查阅 数据 库 厂商 提供 的 手册 ， 以 便 获 
取 完 整 的 关于 窗口 函数 列表 、 语 法 说 明和 更 深 入 的 工作 原理 剖析 等 内 容 。 


A.1 分 组 


开始 讨论 窗口 函数 之 前 ， 你 需要 先 了 解 一 下 SQL 的 分 组 是 如 何 工作 的 。 根 据 我 的 经 验 ， 
ITA (Grouping) 是 许多 人 学 习 SQL 的 过 程 中 一 个 不 容易 跨 过 去 的 坎 儿 。 很 多 时 候 初 学 
者 不 了 解 GROUP BY 子 句 的 工作 原理 ， 也 不 明白 为 什么 使 用 了 GROUP BY 之 后 查询 结果 会 发 
生变 化 。 

简单 来 说 ， 分 组 就 是 把 相似 的 行 数据 聚集 在 一 起 。 如 果 一 个 查询 用 到 了 GROUP BY， 那 么 结 
果 集 的 每 一 行 数据 都 是 一 个 分 组 ， 它 们 分 别 代表 一 行 或 者 几 行 记录 。 并 且 ， 它 们 之 所 以 会 
被 分 在 同一 组 ， 是 因为 这 些 记录 的 某 一 列 或 者 某 儿 列 的 值 相同 。 以 上 就 是 分 组 的 要 点 。 

如 果 说 一 个 分 组 就 是 基于 指定 的 某 一 列 (或 者 儿 列 ) 把 具有 相同 值 的 行 数据 重新 编排 而 成 
的 一 行 具有 代表 性 的 新 数据 ， 那 么 对 于 EMP 表 而 言 ， 显 而 易 见 的 分 组 示例 包括 部 门 编 号 等 
于 10 的 全 体 员 工 〈 这 些 员工 之 所 以 被 分 到 同一 组 ， 是 因为 他 们 的 DEPT 等 于 10)， 以 及 
全 体 文员 (这些 员工 的 J0B='CLERK' ) 。 我 们 来 看 一 些 查询 语句 。 下 列 第 一 个 查询 给 出 了 部 
门 编号 等 于 10 的 所 有 员工 ， 第 二 个 查询 把 部 门 编号 等 于 10 的 员工 分 组 ， 并 返回 一 些 额 外 
的 分 组 信息 : 一 共有 多 少 行 (成 员 的 个 数 )， 最 高 的 工资 以 及 最 低 的 工资 。 
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select deptno,ename 
from emp 
where deptno=10 


DEPTNO ENAME 


10 KING 
10 MILLER 


select deptno, 
count(*) as cnt, 
max(sal) as hi, sal, 
min(sal) as lo, sal 
from emp 
where deptno-10 
group by deptno 


DEPTNO CNT HI, SAL LO SAL 











如 果 SQL 不 支持 把 部 门 编号 等 于 10 的 员工 分 为 一 组 ， 那 么 我 们 就 必须 手动 检查 原始 数据 


才能 获得 上 述 第 二 个 查询 返回 的 那些 信息 。( 如 果 仅 有 3 行 记录 ， 手 动 做 并 不 
如 果 有 300 万 行 记录 ， 又 该 如 何 处 理 呢 ? ) 这 就 引出 了 另 一 个 问题 : 我 们 为 人 


























困难 ， 但 是 , 
| 么 希望 对 数 


据 进行 分 组 ”有 多 种 可 能 的 原因 : 或 许 我 们 想 知 道 有 多 少 个 不 同 的 分 组 ， 也 或 许 我 们 想 计 


算 每 个 分 组 包含 多 少 个 成 员 ( 行 )。 正 如 上 述 查 询 语句 所 示 ， 借 助 SQL 的 分 组 功能 ， 


一 个 表 里 有 许多 行 ， 我 们 也 能 快速 获取 关于 它们 的 信息 ， 而 不 必 逐 行 检查 原始 数据 。 


A.2 SQL 分 组 的 定义 


一 般 而 言 ， 数 学 上 的 “ 群 ”(group) 定义 为 (G, e), KHP G 是 一 个 集合 ， 


即使 


“表示 G 的 二 


进 制 运算 ， 而 e 则 是 G 中 的 成 员 。 我 们 以 该 定义 为 基础 来 说 明 什么 是 SQL 分 组 。 一 个 


SQL 分 组 被 定义 为 (G, e)， 其 中 G 是 一 个 带 有 GROUP BY 子 句 的 、 单 一 的 或 自足 
contained) 查询 语句 的 结果 集 ,，e 是 G 的 成 员 。 并 且 ， 一 个 SQL 分 组 须 满 足下 


定理 。 




















。 对 于 G 的 每 一 个 成 员 e，e 具有 唯一 性 ， 并 且 存 在 一 个 或 者 多 个 e 的 实例 。 
。 对 于 G 的 每 一 个 成 员 e， 聚 合 国 数 COUNT 的 返回 值 大 于 0。 














"V" 述 内 容 ， 我 们 完全 可 以 把 e 替换 成 “ 行 ”， 
由 行 数据 构成 的 结果 集 。 











大 











以 上 SQL 分 组 定义 里 的 结果 集 G 表明 了 一 个 事实 ， 即 SQL 分 组 的 概念 依存 
心 。 于 SQL 查询 ,没有 SQL 查询 就 不 会 有 SQL 分 组 。 因 此 ， 对 于 上 述 定理 的 表 





为 SQL 分 组 在 技术 上 指 的 就 是 





HJ (self- 
下 的 两 个 


上 述 两 个 定理 是 下 面 讨论 SQL 分 组 的 理论 基础 ， 因 此 有 必要 先 证 明 它 们 的 正确 性 〈 并 且 在 














证 明 的 过 程 当 中 ， 我 们 会 像 前 面 一 样 引入 一 些 上 














4 





体 的 SQL 查询 )。 








1. 分 组 不 为 空 


根据 上 文中 的 定义 ， 一 个 分 组 至 少 要 拥有 一 个 成 员 ( 行 )。 如 果 我 们 承认 这 一 点 ， 那 么 也 
可 以 推论 出 : 无 法 从 一 个 空 表 生成 分 组 。 为 证 明 这 个 命题 的 正确 性 ， 可 以 采用 反 证 法 ， 尝 





试 证 明 它 是 错误 的 。 下 夯 
句 基于 该 表 生 成 分 组 。 


create table fruits (name varchar(10)) 


i 给 出 的 例子 先 创 建 了 














select name 
from fruits 
group by name 


(no rows selected) 

select count(*) as cnt 
from fruits 

group by name 

(no rows selected) 

select name, count(*) as cnt 
from fruits 

group by name 


(no rows selected) 





个 空 表 ， 然 后 尝试 通过 3 个 不 同 的 查询 语 





上 述 查 询 结果 说 明 ， 我 们 确实 无 法 从 
2. 分 组 具有 了 唯一 性 





现在 来 证 明 GROUP BY 子 名 生成 的 分 组 具有 唯 
行 一 些 查询 语句 生成 分 组 ， 如 下 所 示 。 


insert 
insert 
insert 
insert 
insert 

















into fruits 
into fruits 
into fruits 
into fruits 
into fruits 


values ('Oranges') 
values ('Oranges') 
values ('Oranges') 
values ('Apple') 
values ('Peach') 


select * 
from fruits 


Oranges 
Oranges 
Oranges 
Apple 
Peach 


select name 


个 空 表 中 生成 任何 分 组 。 





性 。 先 向 FRUITS 表 播 入 5 行 记 录 ， 然 后 执 
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from fruits 
group by name 


Apple 
Oranges 
Peach 


select name, count(*) as cnt 
from fruits 
group by name 


NAME CNT 
Apple 1 
Oranges 3 
Peach 1 


上 述 第 一 个 查询 显示 Oranges 在 FRUITS 表 里 出 现 了 3 次 。 然 而 ， 上 述 第 2 个 和 第 3 个 查询 
(它们 都 使 用 了 GROUP BY) 只 返回 了 一 行 oranges。 这 表明 GROUP BY 结果 集 里 的 每 一 行 (HII 
G 中 包含 的 e， 参 见 前 面 的 定义 ) 都 是 唯一 的 ， 上 述 分 组 的 每 一 个 NAME 值 都 对 应 FRUITS 表 
的 一 行 或 多 行 记录 。 

分 组 具有 了 唯一 性 ， 这 一 点 很 重要 。 换 句 话说 ， 如 果 查 询 语句 使 用 了 GROUP BY 子 句 ， 那 么 通 
常 而 言 SELECT 列表 里 就 不 再 需要 使 用 DISTINCT 关键 字 了 。 



























































9 我 并 不 是 在 说 GROUP BY 等 价 于 DISTINCT。 其 实 它们 是 两 个 完全 不 同 的 概念 。 
<S 。， 我 只 是 想 强调 ， 在 结果 集 里 GROUP BY 子 句 后 面 指定 的 那些 字段 会 先 删除 重复 
人 项 ， 因 而 没有 必要 同时 使 用 DISTINCT 和 GROUP BY, 























Frege 的 抽象 公理 和 罗素 悖 论 
对 于 那些 有 兴趣 深入 探究 的 读者 ， 我 们 不 妨 介绍 一 下 Frege 提出 的 抽象 公理 ， 它 以 
Cantor 的 素 朴 集合 论 为 基础 ， 它 指出 对 于 任何 一 个 明确 指定 的 性 质 ， 都 存在 这 样 一 个 
集合 ， 该 集合 由 所 有 满足 该 性 质 的 个 体 构 成 。 正 如 及 obert Stoll 曾 指 出 的 ， 该 公理 的 问 
题 在 于 “对 抽象 原则 的 无 限制 使 用 " F ARRE Frege 考虑 这 样 一 种 状况 : 如 果 有 一 个 
集合 ， 它 的 成 员 也 是 一 些 集合 ， 并 且 规 定 这 些 集合 的 性 质 为 “不 属于 自身 ”。 


正如 罗素 指出 的 ，Frege 的 抽象 公理 留 下 了 太 多 自由 发 挥 的 空间 ， 如 果 我 们 单 凭 菜 个 条 
件 或 性 质 来 定义 集合 成 员 关 系 ， 那 就 难免 会 出 现 矛盾 的 状况 。 为 了 更 形象 地 解释 这 个 
了 矛盾， 罗素 提出 了 “理发 师 悖 论 (Barber Puzzle )。 理 发 师 悖 论 是 这 样 说 的 :“ 小 镇 上 
有 位 理发 是， 他 为 所 有 不 给 自己 天 胡子 的 男人 各 胡子 ， 并 且 只 为 这 些 男 人 各 胡子 。 可 
是 如 此 一 米 ， 理 发 师 本 人 的 胡子 谁 来 乔 呢 ?” 


我 们 来 看 一 个 具体 的 例子 ， 考 虑 这 样 的 一 个 集合 : y 的 每 一 个 成 员 x， 都 满足 指定 条 件 
已 ， 对 应 的 数学 符号 表示 是 {xe y| PO o 

















既然 上 述 集合 规定 “y 的 每 一 个 成 员 x， 都 满足 指定 条 件 P”"， 那 么 换 一 种 更 直观 的 说 
法 就 是 ,“ 当 且 仅 当 x 满足 指定 条 件 P 时 , x 是 y 的 成员。” 

现在 我 们 规定 ， 条 件 P(x) 的 定义 是 “x 不 是 x 的 成 员 ”， 即 (x ~e x)。 

这 样 一 来 ， 上 面 的 表述 就 变 成 了 “ 当 且 仅 当 x 不 是 x 的 成 员 时 , x E y XU, B x 
ey|(x~ex)} o 

此 时 ， 我 们 不 妨 问 自己 一 个 问题 : 上 述 集合 是 不 是 它 自身 的 一 个 成 员 ? 在 此 我 们 假设 
x 一， 并 再 次 推演 一 下 上 述 集合 的 数学 表示 。 如 下 所 示 的 集合 可 以 被 定义 为 “ 当 且 仅 
当 y 不 是 y 的 成 员 时 , y 是 了 的 成 员 ”， 即 fy ey|(y~ey)}。 

简 而 言 之 ， 罗 素 悖 论 把 我 们 推 入 了 一 种 两 难 的 境地 ， 有 一 个 集合 同时 满足 两 个 相互 矛 
盾 的 条 件 : 它 属于 其 自身 ， 同 时 又 不 属于 其 自身 。 直 觉 上 我 们 可 能 认为 这 根本 就 不 该 
成 为 一 个 问题 。 确 实 ， 一 个 集合 怎么 可 能 属于 自身 呢 ? 毕竟 ， 由 所 有 书籍 构成 的 集合 
并 不 会 是 一 本 书 。 那 么 ， 为 什么 该 悖 论 会 被 提出 来 ， 并 作为 一 个 悖 论 而 存在 呢 ? 这 是 
因为 当 我 们 站 在 更 高 的 抽象 层面 考虑 集合 理论 时 ， 该 悖 论 的 存在 价值 就 凸显 出 来 了 。 
例如 ， 罗 素 悖 论 的 一 个 相对 具有 实用 价值 的 运用 场景 是 ， 探 讨 “ 所 有 集合 的 集合 ” 问 
题 。 对 于 “所 有 集合 的 集合 ”这 样 一 个 概念 ， 根 据 其 定义 ， 它 必须 是 其 自身 的 一 个 成 
M (因为 它 是 所 有 集合 的 集合 )。 那么 ， 如 果 把 Po) 加 于 “所 有 集合 的 集合 ”之 上 ， 
又 会 如 何 呢 ?简单 来 说 ， 我 们 参照 罗素 悖 论 会 推导 出 “ 当 且 仅 当 所 有 集合 的 集合 不 是 
其 自身 的 一 个 成 员 时 ， 它 是 其 自身 的 一 个 成 员 ”， 显 然 这 是 一 个 矛盾 。 


如 果 你 有 兴趣 追根 究 底 ，Ernst Zermelo 后 来 提出 了 分 离 公理 模式 (也 被 称 作 受 限 概括 
公理 模式 或 者 分 类 公理 )， 完 美 地 规避 了 素 朴 集合 论 的 罗素 悖 论 问题 。 








3. COUNT 永 远大 于 0 























前 文中 的 查询 语句 及 其 结果 也 证 明了 最 后 一 个 定理 的 正确 性 ， 即 针对 一 个 非 空 的 表 执 行 
GROUP BY 查询 ， 那 么 聚合 函数 COUNT 的 返回 值 不 会 等 于 0。 这 一 点 没什么 可 奇怪 的 ， 针 对 





一 个 分 组 执行 COUNT 查询 确实 不 可 能 返 








回 0。 我 们 已 经 证 明了 ， 无 法 从 一 个 空 表 里 生成 分 





组 ， 因 此 一 个 分 组 至 少 会 含有 1 行 数据 。 既 然 至 少 有 1 行 数据 ， 那 么 COUNT 查询 的 结果 自 


然 至 少 等 于 1。 








~ 查询 当然 会 得 到 0。 


A.3 "Eit 





注意 ， 以 上 我 们 讨论 的 是 同时 使 用 COUNT 和 GROUP BY 的 状况 ， 这 和 只 使 用 
。 COUNT 的 状况 有 所 不 同 。 如 果 不 要 GROUP BY 子 句 ， 针 对 一 个 空 表 执行 COUNT 


“工作 结束 之 际 才 发 现 那 大 厦 的 基础 已 经 动摇 ， 对 于 一 个 科学 工作 者 来 说 ， 再 也 
没有 比 这 更 为 不 幸 的 事情 了 …… 在 收 到 罗素 先生 的 一 封 信之 后 ， 我 便 陷入 了 两 难 





境地 ， 而 此 时 我 的 作品 即将 付 印 。” 
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罗素 发 现 了 Frege 的 抽象 公理 中 存在 的 了 矛盾， 上 述 引 言 就 是 Frege 意识 到 该 问题 之 后 的 











反应 。 


悖 论 通常 会 针对 已 有 的 理论 或 观点 构造 出 若干 矛盾 的 场景 。 许 多 时 候 ， 这 些 矛 盾 的 影响 可 


以 被 限制 在 一 个 较 小 的 范围 之 内 ， 并 且 能 够 通过 一 些 





果 它 们 仅 对 少数 测试 案例 成 立 ， 这 样 多 数 时 候 我 们 都 角 


你 可 能 猜 到 了 我 们 为 什么 要 在 这 里 讨论 悖 论 的 问题 ， 











“变通 手段 ”消除 其 影响 。 或 者 ， 如 





E 放 心地 忽略 掉 它 们 。 




















因为 前 面 给 出 的 SQL 分 组 定义 确实 


存在 一 个 悖 论 ， 我 们 必须 要 在 这 里 认真 讨论 。 尽 管 到 目前 为 止 我 们 一 直 在 讨论 分 组 的 问 


题 ， 但 最 终 仍 然 要 回 到 SQL 查询 上 。GROUP BY 后 面 可 以 接 多 种 语法 元 素 : 最 常 出 现 的 是 表 











的 某 一 列 或 者 几 列 ， 除 此 之 外 ， 还 可 能 会 出 现 常量 和 表达 式 。 我 们 由 此 获得 了 很 好 的 灵活 
性 ,但 也 被 迫 要 付出 代价 ， 因 为 在 SQL 中 的 Null 也 是 一 种 合法 的 “ 值 ”*。Null 的 问题 在 
于 它 会 被 聚合 函数 自动 忽略 掉 。 比 如 ， 如 果 一 个 表 只 有 一 行 一 列 ， 并 且 它 的 值 是 Null, JB 












































么 如 果 我 们 针对 该 表 执 行 一 个 既 包 含 GROUP BY 又 包含 聚合 国 数 COUNT 的 查询 会 得 到 什么 结 
果 呢 ? 根据 前 面 给 出 的 定义 ， 如 果 既 有 GROUP BY, XARA RZ COUNT， 则 返回 值 必 然 会 
大 于 或 等 于 1。 那么 ， 在 函数 COUNT 忽略 掉 Null 值 的 情况 下 ， 结 果 会 如 何 呢 ? 这 种 状况 又 
会 对 SQL 分 组 定义 带 来 什么 样 的 影响 呢 ? 我 们 来 看 看 下 面 的 例子 ， 它 展示 了 上 述 Null 分 
组 悖 论 。 (为 增强 查询 结果 的 可 读 性 ， 这 里 用 到 了 COALESCE 函数 。) 




















select * 
from fruits 


Oranges 
Oranges 
Oranges 
Apple 
Peach 


insert into fruits values (null) 
insert into fruits values (null) 
insert into fruits values (null) 
insert into fruits values (null) 
insert into fruits values (null) 


select coalesce(name, NULL') as name 
from fruits 


Oranges 
Oranges 
Oranges 



































select coalesce(name,'NULL') as name, 
count(name) as cnt 
from fruits 
group by name 


NAME CNT 
Apple 1 
NULL 0 
Oranges 3 
Peach 1 








如 上 所 示 ， 正 是 由 于 上 述 Null 值 的 出 现 ， 我 们 的 SQL 分 组 定义 现在 被 迫 要 面 对 一 个 矛盾 
的 场景 ， 即 “ 悖 论 ”。 所 幸 这 个 矛盾 并 不 是 什么 大 问题 ， 因 为 它 更 多 地 肇始 于 聚合 函数 的 
实现 方式 ， 而 且 和 前 面 给 出 的 定义 本 身 关系 不 大 。 对 于 上 述 最 后 面 的 那个 查询 语句 ， 如 果 
用 自然 语言 表述 问题 的 话 应 该 是 这 样 的 : 

计算 FRUITS 表 里 每 一 种 水 果 出 现 的 次 数 ， 即 统计 每 一 个 分 组 对 应 多 少 个 成 员 。 


回头 再 看 一 下 上 面 的 那些 INSERT 语句 ， 很 明显 我 们 一 共 插 入 了 5 行 NuLL 值 ， 也 就 是 说 
Null 分 组 包含 5 个 成 员 。 


Ao 













































































不 同 于 通常 类 型 的 值 ，NutL 有 其 特殊 的 性 质 ， 它 不 会 等 于 任何 值 ， 但 是 可 以 
《4 、 作 为 分 组 成 员 而 存在 。 











查询 语句 要 怎么 写 才 能 不 返回 0 而 返回 5， 既 能 返回 我 们 需要 的 值 ， 又 不 违背 SQL 分 组 的 
定义 呢 ? 如 下 所 示 的 例子 使 用 了 一 种 变通 的 做 法 ， 消 除 Null 分 组 悖 论 的 影响 。 


select coalesce(name,'NULL') as name, 
count(*) as cnt 
from fruits 
group by name 


NAME CNT 
Apple 1 
Oranges 3 
Peach 1 
NULL 5 

















如 果 不 使 用 COUNT(NAME) 而 改 用 COUNT(*) 的 话 ， 就 能 规避 掉 Null 22 2B RYE. An fex R. 
体 的 列 名 做 参数 ， 则 聚合 函数 会 忽略 掉 Null 值 。 但 是 ， 传 递 星 号 * 而 不 是 列 名 给 COUNT FR 
数 ， 返 回 值 就 不 会 等 于 0 了 。 星 号 * 迫使 COUNT 函数 去 计算 行 数 ， 而 不 是 实际 的 列 值 ， 这 
样 一 来 不 论 具 体 的 列 值 是 不 是 NtL， 都 不 会 影响 最 终 的 返回 值 。 


男 一 个 悖 论 针对 的 是 定理 “结果 集中 每 一 个 分 组 ( 即 G 中 包含 的 每 一 个 e) 具有 唯一 性 ”。 
从 本 质 上 来 说 ，SQL 结果 集 和 表 其 实 不 是 集合 (因为 允许 出 现 重复 行 )， 更 准确 的 定义 应 
该 是 多 重 集合 (multiset 或 bag)， 因 此 我 们 有 可 能 生成 包含 重复 分 组 的 结果 集 。 考 虑 如 下 
所 示 的 查询 语句 。 
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select coalesce(name,'NULL') as name, 
count(*) as cnt 
from fruits 
group by name 
union all 
select coalesce(name, NULL') as name, 
count(*) as cnt 
from fruits 
group by name 


Apple 
Oranges 
Peach 
NULL 
Apple 
Oranges 
Peach 
NULL 


UuimÍ|umnbumnusnmdH 


select x.* 
from ( 
select coalesce(name, NULL') as name, 
count(*) as cnt 
from fruits 
group by name 
) x, 
(select deptno from dept) y 


Oranges 
Oranges 
Oranges 
Oranges 
Peach 
Peach 
Peach 
Peach 
NULL 
NULL 
NULL 
NULL 


上 述 所 示 的 最 终结 果 中 都 出 现 了 重复 的 分 组 。 不 过 ， 所 幸 该 悖 论 仅 仅 就 局 部 问题 展开 攻 
击 ， 因 此 我 们 不 需要 太 过 担心 。 分 组 的 第 一 个 性 质 是 ， 对 于 (G,e) 而 言 ，G 是 一 个 带 有 
GROUP BY 子 句 的 、 单 一 的 或 自足 的 查询 语句 的 结果 集 。 简 单 地 说 ， 任 何 GROUP BY 查询 返回 
的 结果 集 都 符合 分 组 的 定义 。 read GROUP BY 查询 的 结果 合并 起 来 的 时 候 ， 才 可 能 生 
成 含有 重复 分 组 的 多 重 集合 。 上 述 第 一 个 示例 使 用 了 UNION ALL， 这 不 是 一 个 集合 运算 ， 而 


Ui Ui Ui Ui I^ H HI: E UJ UJ UJ UJ H^. HB P. = 
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是 一 个 多 重 集合 运算 ， 实 际 上 它 是 两 个 查询 ， 分 两 次 执行 GROUP BY 操作 。 


UNION 是 一 种 集合 和 运算， 使 用 UNION 就 不 会 出 现 重复 分 组 了 。 








上 述 第 二 个 查询 使 用 了 笛 卡 儿 积 ， 它 首先 生成 分 组 ， 然 后 再 执行 笛 卡 儿 积 。 从 一 个 自足 的 
GROUP BY 查询 的 角度 来 看 ， 它 实际 上 不 违背 我 们 的 SQL 分 组 定义 。 因 此 ， 上 述 两 个 例子 并 
没有 丝毫 撼动 我 们 给 出 的 SQL 分 组 定义 。 相 反 ， 它 们 证 明了 该 定义 的 完备 性 ， 因 此 我 们 不 
会 再 有 所 怀疑 了 。 


A.4 SELECT 和 GROUP BY 的 关系 


前 文 给 出 了 SQL 分 组 的 定义 并 给 出 了 证 明 ， 现 在 可 以 讨论 更 多 关于 GROUP BY 查询 的 实际 
问题 。 对 于 SQL 分 组 ， 理 解 SELECT 子 句 和 GROUP BY 子 句 之 间 的 关系 很 重要 。 如 果 我 们 要 
使 用 诸如 COUNT 这 样 的 聚合 函数 ， 就 必须 记 住 SELECT 列表 里 的 任何 字段 ， 只 要 它 不 是 聚合 
国 数 的 参数 ， 那 么 它 必 须 成 为 分 组 的 一 部 分 。 比 如 ， 对 于 如 下 所 示 的 查询 语句 。 


select deptno, count(*) as cnt 
from emp 























DEPTNO 必须 被 放 入 GROUBY 子 句 。 


select deptno, count(*) as cnt 
from emp 
group by deptno 


DEPTNO CNT 
10 3 
20 5 
30 6 


上 述 规 则 并 非 绝 对 ， 也 有 一 些 例外 情况 。 例 如 ， 常 量 、 用 户 自 定义 函数 的 标量 返回 值 、 窗 
口 函 数 以 及 非 相 关 标 量子 查询 (non-correlated scalar subquery), SELECT 子 句 会 在 GROUP BY 
子 句 之 后 被 执行 ， 因 而 这 些 语法 元 素 可 以 出 现在 SELECT 列表 中 ， 而 不 必 (有 些 状 况 下 也 不 
允许 ) 出 现在 GROUP BY 子 句 里 。 例 如 ， 


select 'hello' as msg, 
1 as nun, 
deptno, 
(select count(*) from emp) as total, 
count(*) as cnt 
from emp 
group by deptno 








MSG NUM DEPTNO TOTAL CNT 


hello 1 10 14 3 
hello 1 20 14 5 
hello 1 30 14 6 
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上 述 查 询 可 能 会 让 你 感到 困惑 。SELECT 列表 里 那些 额外 的 项 目 虽 然 没 有 被 放 入 GROUP BY F 
名 ， 但 是 每 个 DEPTNO 对 应 的 CNT 值 并 不 会 因此 而 改变 ，DEPTN0 的 值 也 不 会 被 改变 。 那 么 ， 
我 们 不 妨 根 据 该 查询 结果 修改 一 下 规则 ， 使 其 表述 更 加 准确 。 

如 果 SELECT 列表 里 的 项 目 可 能 会 改变 分 组 或 者 改变 聚合 函数 的 返回 值 ， 则 该 项 

目 必须 被 放 入 GROUP BY F ëJ , 
ERAKI SELECT 列表 虽然 额外 添加 了 一 些 项 目 ， 但 是 它 既 不 会 改变 任何 分 组 (每 个 
DEPTNO) 的 CNT 值 ， 也 不 会 改变 分 组 本 身 。 
现在 ， 可 以 问 这 样 的 问题 了 : 到 底 SELECT 列表 中 哪些 项 目 可 能 会 改变 分 组 或 者 聚合 函数 的 
返回 值 呢 ? 答案 很 简单 : 我 们 想 要 检索 的 表 的 其 他 列 。 为 上 述 查询 添加 一 个 308 列 。 


select deptno, job, count(*) as cnt 
from emp 
group by deptno, job 









































DEPTNO JOB CNT 


10 PRESIDENT 
20 CLERK 

20 ANALYST 
20 MANAGER 
30 CLERK 

30 MANAGER 
30 SALESMAN 


为 了 把 额外 的 JOB 列 也 从 EM 表 里 提取 出 来 ， 分 组 的 方式 和 查询 结果 集 都 要 随 之 发 生 改变 。 
因而 我 们 必须 把 DEPTNO 和 JOB 一 起 放 入 GROUP BY 子 句 ， 否 则 上 述 查 询 语句 不 可 能 正常 执 
行 。 在 SELECT 和 GROUP BY 子 名 里 都 引入 JOB 列 ， 意 味 着 整个 查询 的 语义 从 “计算 每 个 部 门 
有 多 少 位 员工 ” 变 成 了 “计算 每 个 部 门 有 多 少 个 不 同 的 职位 ”。 在 这 里 我 要 再 次 提醒 你 广 
意 , 分 组 具有 唯一 性 ， 尽 管 拆 开 来 看 的 话 ，DEPTNO 和 JOB 的 值 有 重复 ， 但 是 每 一 个 DEPTNO 
FO JOB 组 合 (它们 同时 出 现在 GROUP BY 子 句 和 SELECT 列表 里 ， 因 此 属于 同一 个 分 组 ) 都 是 
独一无二 的 。( 例 如 ，19 和 CLERK 只 出 现 过 一 次 。) 
我 们 也 可 以 在 SELECT IJ HL H kB ER r, < EE GROUP BY 子 句 里 就 可 以 放任 何 列 了 。 看 
一 下 如 下 所 示 的 两 个 查询 语句 ， 它 们 展示 了 这 种 做 法 。 
select count(*) 


from emp 
group by deptno 


+P p pP NN pP P, 









































COUNT(*) 


select count(*) 

















from emp 
group by deptno,job 


COUNT(*) 


人 上 上 上 让 NE 




















并 不 是 一 定 要 为 SELECT 列表 添加 一 些 非 聚合 函数 ， 但 为 了 提高 查询 结果 的 可 读 性 和 可 用 
性 ， 我 们 通常 会 这 么 做 。 


Hoa 








. 作为 一 项 规定 ， 同 时 使 用 GROUP BY 和 聚合 函数 的 时 候 ， 对 于 SELECT 列表 里 

p^ 的 任何 项 目 而 言 ， 只 要 它 不 是 聚合 函数 的 参数 ， 那 么 它 就 必须 被 放 入 GROUP 

W Bv 子 句 。 然 而 ，MySQL 有 一 个 特色 功能 ， 它 允许 我 们 写 出 不 遵守 该 规定 的 
SQL， 即 我 们 可 以 向 SELECT 列表 加 入 一 列 ， 该 列 既 不 是 聚合 了 国 数 的 参数 ， 也 
不 必 作 为 GROUP BY 子 句 的 一 部 分 而 出 现 。 虽 然 可 以 宽泛 地 称 之 为 特色 功能 ， 
但 这 其 实 是 一 个 随时 会 引发 问题 的 软件 缺陷 ， 我 强烈 建议 你 不 要 使 用 它 。 事 
实 上 ， 如 果 你 平常 使 用 MySQL 工作 并 在 意 查询 语句 的 精准 性 ， 我 建议 你 不 
使 用 这 个 所 谓 的 特色 功能 。 


A.5 窗口 操作 


一 旦 理解 了 分 组 的 概念 并 掌握 了 SOL 聚合 运算 ， 就 比较 容易 理解 窗口 函数 了 。 就 像 聚合 国 
数 一 样 ， 窗 口 函 数 针对 指定 的 行 集合 (分 组 ) 执行 聚合 运算 。 不 同 之 处 在 于 ， 窗 口 函数 能 
够 为 每 个 分 组 返回 多 个 值 ， 而 聚合 函数 只 能 返回 单一 值 。 聚 合 运算 的 对 象 其 实 是 一 组 行 记 
录 ， 我 们 称 之 为 “窗口 ”( 因 此 才 有 了 术语 “窗口 函数 ”)。DB2 把 这 一 类 函数 称 为 “OLAP 
KO” (ERO PTAL KA), Oracle 则 称 之 为 “分 析 函 数 ”(Analytic Function) ; 本 书 遵 
循 ISO SQL 标准 的 叫 法 ， 统 一 使 用 术语 “窗口 函数 ”。 

口 一 个 简单 的 例子 

假设 我 们 希望 计算 整个 公司 的 员工 人 数 ， 传 统 的 做 法 是 针对 EM 表 调 用 COUNT(*)。 


select count(*) as cnt 
from emp 


















































以 上 做 法 当然 非常 方便 ， 但 是 有 时 候 我 们 可 能 需要 从 非 聚 合 数据 行 或 者 从 不 同 纬度 的 聚合 
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数据 行 里 访问 这 一 类 聚合 运算 结 采 。 窗 口 函 数 能 帮助 我 们 轻松 完成 这 一 类 操作 。 例 如 ， 下 











面 的 查询 语句 展示 了 如 何 使 用 窗口 函数 同时 检索 出 明细 行 (每 个 员工 一 行 ) 和 聚合 运算 结 


果 (员工 总 人 数 )。 


select ename, 


deptno， 
count(*) over() as cnt 
from emp 
order by 2 

ENAME DEPTNO CNT 
CLARK 10 14 
KING 10 14 
MILLER 10 14 
SMITH 20 14 
ADAMS 20 14 
FORD 20 14 
SCOTT 20 14 
JONES 20 14 
ALLEN 30 14 
BLAKE 30 14 
MARTIN 30 14 
JAMES 30 14 
TURNER 30 14 
WARD 30 14 





上 述 示例 调用 了 窗口 国 数 COUNT(*) OVER( )。 关 键 字 OVER 表明 COUNT 函数 会 作为 窗口 函数 
来 调用 ， 而 不 是 一 次 普通 的 聚合 函数 调用 。 基 本 上 ，SQL 标准 中 列 出 的 全 部 聚合 函数 都 能 




















用 作 窗 口 函数 ， 关 键 字 OVER 的 作用 是 帮助 语法 解析 器 区 分 不 同 的 使 用 场景 。 


那么 ，COUNT(*) OVER() 到 底 做 了 什么 操作 呢 ? 它 为 上 述 查 询 语句 返回 的 每 一 行 数 据 提供 了 
额外 的 一 列 ， 该 列表 示 EMP 表 一 共有 多 少 行 记 录 。 在 这 里 关键 字 OVER 后 面 的 圆 括号 是 空 



































的 ， 甚 实 我 们 也 可 以 在 里 面 放 上 一 个 额外 的 子 句 ， 以 指明 窗口 函数 操作 的 行 记 录 范 围 。 保 
持 圆 括号 里 什么 也 没有 ， 这 是 明确 告知 窗口 函数 把 全 体 行 记录 作为 操作 对 象 ， 因 此 上 述 每 














一 行 输出 结果 都 是 14。 























我 希望 你 能 开始 认识 到 ， 窗 口 函 数 的 方便 之 处 在 于 它 可 以 在 一 行 之 中 同时 执行 多 种 不 同 维 








度 的 聚合 运算 。 后 面 我 们 会 继续 给 出 更 多 实例 帮助 你 型 


A.6 执行 时 机 















































HER 





强大 的 功能 。 





在 继续 深入 探讨 OVER 子 句 之 前 ， 有 必要 先 理 清 一 个 重要 的 问题 ， 即 窗口 函数 的 执行 会 被 安 
排 在 整个 SQL 处 理 的 最 后 一 步 ， 但 会 先 于 ORDER BY 子 名 执行 。 下 面 举例 说 明 窗 口 函数 的 





执行 时 机 ， 这 里 我 们 为 前 一 节 的 查询 语句 加 上 一 个 WHERE 子 句 ， 以 过 滤 掉 DEPTNO 等 于 20 


和 30 的 员工 。 


select ename, 
deptno， 
count(*) over() as cnt 

















from emp 
where deptno = 10 


order by 2 
ENAME DEPTNO CNT 
CLARK 10 3 
KING 10 3 
MILLER 10 3 











一 行 的 CNT 值 不 再 是 14， 而 是 变 成 了 3。 在 上 述 示例 中 ， 正 是 因 














条 集 限 制 为 3 行 ， 才 导致 窗口 函数 的 返回 值 变 成 了 3。( 当 SQL Abg 


候 ， 就 只 剩 下 3 行 数据 留 给 窗口 函数 了 。) 该 示例 表明 WHERE 和 GROUP BY 这 一 





完 之 后 ， 才 轮 到 窗口 函数 执行 。 


A.7 分 区 








为 WHERE 子 句 先行 把 结 
到 SELECT 子 名 的 时 
类 子 句 执行 


可 以 使 用 PARTITION BY 子 名 针对 行 数 据 进行 分 区 (partition) 或 者 分 组 (group) ， 并 根据 其 











结果 执行 聚合 运算 。 我 们 在 前 画 


的 示例 中 看 到 过 ， 如 果 OVER 关键 字 后 








号 ， 那 么 窗口 国 数 执行 聚合 运 





























我 们 不 妨 把 PARTITION BY FA 








血 跟 着 一 个 空 的 贺 














括 


算 时 ， 会 把 该 查询 结果 集 整 体 作 为 一 个 分 区 来 看 待 。 因 此 ， 
里 解 成 “动态 的 GROUP BY”， 它 不 同 于 传统 的 GROUP BY， 因 为 


在 最 终 的 结果 集中 允许 出 现 多 种 由 PARTITION BY 生成 的 分 区 。 借 助 PARTITION BY 针对 指定 


e N E 



































june l AE E 
回 一 组 具有 代表 性 的 行 记录 。 下 面 








wi mu s EET 


select ename, 


count(*) over(partition by deptno) as cnt 


deptno, 
from emp 
order by 2 
ENAME DEPTNO CNT 
CLARK 10 3 
KING 10 3 
MILLER 10 3 
SMITH 20 5 
ADAMS 20 5 
FORD 20 5 
SCOTT 20 5 
JONES 20 5 
ALLEN 30 6 
BLAKE 30 6 
MARTIN 30 6 
JAMES 30 6 
TURNER 30 6 
WARD 30 6 





上 述 查 询 仍 然 会 返回 EM 表 的 全 








则 所 有 


部 14 行 记录 ， 但 是 由 于 使 用 了 PARTITION BY DEPTNO 子 句 ， 
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_ KA ERE COUNT 会 分 别 计 算出 每 一 个 部 门 的 员工 人 数 。 只 有 当 部 门 发 生变 化 时 ， 聚 























运算 的 结果 才 会 被 重新 计算 ， 因 此 同一 个 部 门 〈 同 一 个 分 区 ) 的 员工 会 得 到 相同 的 CNT 





同时 我 们 也 要 注意 到 ， 每 一 个 分 区 的 信息 都 会 被 返回 ， 





每 一 个 分 区 的 所 有 成 员 也 都 会 


被 返回 。 和 下 面 的 这 个 查询 语句 相 比 ， 上 述 使 用 窗口 函数 的 查询 更 为 高 效 。 




















select e.ename, 
e.deptno, 
(select count(*) from emp d 
where e.deptno=d.deptno) as cnt 


from emp e 
order by 2 
ENAME DEPTNO CNT 
CLARK 10 3 
KING 10 3 
MILLER 10 3 
SMITH 20 5 
ADAMS 20 5 
FORD 20 5 
SCOTT 20 5 
JONES 20 5 
ALLEN 30 6 
BLAKE 30 6 
MARTIN 30 6 
JAMES 30 6 
TURNER 30 6 
WARD 30 6 


相 较 于 传统 的 GROUP BY, PARTITION BY 子 句 的 另 一 个 好 处 是 ， 在 同一 个 SELECT 语句 里 我 们 
可 以 按照 不 同 的 列 进行 分 区 ， 而 且 不 同 的 窗口 函数 调用 之 间 互 不 影响 。 看 一 下 如 下 所 示 的 
查询 ， 它 会 逐一 列 出 全 体 员 工 ， 并 返回 每 一 个 人 所 属 的 部 门 ， 所 在 部 门 的 员工 总 数 ， 每 一 




















个 人 的 职位 ， 以 及 公司 范围 内 从 事 相 同 工 作 的 员工 总 数 。 


select ename, 





deptno, 
count(*) over(partition by deptno) as dept cnt, 
job, 
count(*) over(partition by job) as job cnt 
from emp 
order by 2 
ENAME DEPTNO DEPT CNT JOB JOB CNT 
MILLER 10 3 CLERK 4 
CLARK 10 3 MANAGER 3 
KING 10 3 PRESIDENT T 
SCOTT 20 5 ANALYST 2 
FORD 20 5 ANALYST 2 
SMITH 20 5 CLERK 4 
JONES 20 5 MANAGER 3 
ADAMS 20 5 CLERK 4 
JAMES 30 6 CLERK 4 























MARTIN 30 6 SALESMAN 4 
TURNER 30 6 SALESMAN 4 
WARD 30 6 SALESMAN 4 
ALLEN 30 6 SALESMAN 4 
BLAKE 30 6 MANAGER 3 





从 上 述 结果 集中 可 以 看 到 ， 同 一 个 部 门 的 员工 会 对 应 相同 的 DEPT. CNT 值 ， 从 事 相同 工作 的 
员工 也 都 会 得 到 同样 的 JOB_CNT 值 。 


到 目前 为 止 ， 我 们 已 经 讨论 完了 PARTITION BY 子 句 的 工作 原理 ， 它 与 GROUP BY 子 句 类 似 ， 
但 它 不 会 影响 SELECT 子 句 的 其 他 项 目 ， 也 不 要 求 我 们 写 一 个 GROUP BY 子 句 。 


A.8 NuLL 的 影响 


类 似 于 GROUP BY 子 句 ，PARTITION BY 子 句 会 把 所 有 的 Null 归 入 同一 个 分 区 或 者 分 组 。 
Jb, PARTITION BY 对 Null 值 的 影响 也 类 似 于 GROUP BY。 下 面 的 查询 调用 了 一 个 窗口 函数 来 
计算 每 一 种 业务 提成 对 应 的 员工 人 数 。( 为 增强 查询 结果 的 可 读 性 ， 当 业务 提成 为 Null 时 
返回 -1。) 


























select coalesce(comm,-1) as comm, 
count(*)over(partition by comm) as cnt 


from emp 
COMM CNT 
0 1 
300 1 
500 1 
1400 1 
-1 10 
-1 10 
-1 10 
-1 10 
-1 10 
-1 10 
-1 10 
-1 10 
-1 10 
-1 10 


上 述 查 询 使 用 了 COUNT(*)， 因 而 返回 值 是 相应 的 记录 行 数 。 我 们 看 到 有 10 个 员工 的 业务 
提成 为 NNLL。 然 而 ， 如 果 不 用 *， 而 改 用 COM 列 的 话 ， 查 询 结果 就 大 相 径 庭 了 。 


select coalesce(comm,-1) as comm, 
count(comm)over(partition by comm) as cnt 





from emp 
COMM CNT 
0 1 
300 1 
500 1 
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由 于 上 述 查 询 使 用 了 COUNT(COMM) ， 它 只 会 计数 不 为 Nutl 的 com 值 。 我 们 看 到 ， 业 务 提成 
等 于 0 的 员工 有 1 个 ， 等 于 300 的 有 1 个 ， 等 等 。 但 是 要 特别 注意 业务 提成 为 Null 的 人 
数 ! 查询 结果 是 0， 为 什么 呢 ” 因 为 聚合 函数 会 忽略 掉 NULL 值 ， 更 准确 地 说 ， 聚 合 国 数 仅 
仅 计数 非 NULL 值 。 


on 





当 使 用 COUNT 函数 时 ， 我 们 应 该 思考 一 下 是 否 要 把 Null 包括 在 内 。 使 用 
We a. COUNT(column) 会 忽 上 mutL。 如 果 希 望 把 NULL 值 一 并 计 入 ， 则 应 该 使 用 
“COUNT(*)。( 此 时 我 们 要 计算 的 不 是 实际 的 列 值 ， 而 是 希望 知道 有 多 少 行 。) 


A.9 排序 


在 使 用 窗口 函数 的 时 候 ， 数 据 的 排序 方式 可 能 会 对 最 终 的 查询 结果 产生 实质 性 的 影响 。 
此 ， 窗 口 函数 的 OVER 子 句 也 支持 ORDER BY 语法。 我们 可 以 使 用 ORDER BY 子 句 指定 分 区 内 
的 行 数据 如 何 排序 。( 记 住 ， 如 果 OVER 关键 字 后 面 没有 出 现 PARTITION BY 子 句 ， 则 此 处 的 
“分 区 ” 指 的 就 是 整个 查询 结果 集 。) 












































部 分 窗口 函数 强制 要 求 对 涉及 的 分 区 数据 做 排序 。 因 此 ， 对 于 这 部 分 窗口 函数 
而 言 ，ORDER BY 不 可 省 略 。 在 写作 本 书 时 ，SQL Server 不 支持 在 聚合 窗口 国 数 
(aggregate window function) 的 OVER 子 句 中 使 用 ORDER BY。 但 是 ，SQL Server 
允许 在 排名 窗口 函数 (window ranking function) 的 OVER 子 句 中 使 用 ORDER BY, 

















LE 


在 窗口 函数 的 OVER 子 句 中 使 用 ORDER BY 时 ， 我 们 实际 上 是 在 决定 两 件 事 。 

(1) 分 区 内 的 行 数据 如 何 排 序 ， 

(2) 计算 涉及 哪些 行 数据 。 

我 们 来 看 一 下 如 下 所 示 的 查询 ， 该 查询 计算 出 了 DEPTNO 等 于 10 的 员工 的 工资 累计 合计 值 。 


select deptno, 
ename, 
hiredate, 
sal, 
sum(sal)over(partition by deptno) as totali, 
sum(sal)over() as total2, 
sum(sal)over(order by hiredate) as running, total 

















from emp 
where deptno=10 


DEPTNO ENAME HIREDATE SAL TOTAL1 TOTAL2 RUNNING_TOTAL 
10 CLARK 09-JUN-1981 2450 8750 8750 2450 
10 KING  17-NOV-1981 5000 8750 8750 7450 
10 MILLER 23-JAN-1982 1300 8750 8750 8750 


Cu 注意 ， 其 中 一 个 sun 查询 后 面 的 圆 括号 是 空 的 。 那 么 ， 为 什么 ToTAL1 和 
JE onc 查询 结果 相同 呢 ? 这 里 要 再 次 说 明 一 下 ， 是 窗口 函数 的 执行 时 机 决定 

-一 一 了 上 述 结果 。 经 过 WHERE 子 名 的 过 滤 ， 合 计 的 对 象 就 只 剩 下 DEPTNO 等 于 10 
的 工资 了 。 在 上 述 示例 中 只 存在 一 个 分 区 ， 即 整个 结果 集 只 包括 DEPTNO 等 于 
10 的 记录 。 因 此 ，TOTAL1 和 TOTAL2 具有 相等 的 值 。 





























只 要 看 一 下 SAL 列 的 值 ， 就 能 理解 RUNNING TOTAL 值 是 如 何 计算 出 来 的 了 。 我 们 还 可 以 
逐一 累加 各 个 工资 值 ， 用 实际 计算 结果 验证 上 述 累 计 合计 值 的 查询 结果 。 但 是 还 有 更 重 
要 的 一 点 ， 为 什么 在 计算 累计 合计 值 的 时 候 要 为 OVER 子 句 加 上 ORDER BY? 这 是 因为 在 
OVER 子 句 里 加 上 ORDER BY 之 后 ， 尽 管 我 们 看 不 到 ， 实 际 上 却 是 在 分 区 内 部 指定 了 一 个 默 
认 的 “滑动 窗口 "。 正 是 由 于 ORDER BY HIREDATE 子 句 的 存在 才 使 得 合计 运算 能 够 自动 终 
止 于 当前 行 。 
如 下 所 示 的 查询 与 前 面 那 个 查询 等 价 ， 它 使 用 了 RANGE BETWEEN 子 句 显 式 地 指定 了 ORDER BY 
HIREDATE 的 默认 行为 方式 。( 我 们 稍 后 会 详细 讨论 RANGE BETWEEN 子 句 。) 
select deptno, 

ename, 

hiredate, 

sal, 

sum(sal)over(partition by deptno) as totali, 

sum(sal)over() as total2, 

sum(sal)over(order by hiredate 


range between unbounded preceding 
and current row) as running total 








from emp 
where deptno-10 


DEPTNO ENAME X HIREDATE SAL TOTAL1 TOTAL2 RUNNING TOTAL 
10 CLARK 09-JUN-1981 2450 8750 8750 2450 
10 KING  17-NOV-1981 5000 8750 8750 7450 
10 MILLER 23-JAN-1982 1300 8750 8750 8750 





上 述 查 询 中 出 现 的 RANGE BETWEEN 子 句 在 ANSI 标准 中 被 称 作 Framing 子 句 ， 本 书 中 我 将 统 
一 使 用 该 术语 。 现 在 ， 你 应 该 已 经 清楚 我 们 为 什么 要 通过 在 OVER 子 句 中 指定 ORDER BY 来 
计算 累计 合计 值 。 我 们 想 要 告诉 查询 语句 要 针对 从 第 一 行 开始 直至 当前 行为 止 的 全 部 行 记 
录 执 行 合计 运算 。( 这 也 是 默认 行为 ，ORDER Bv 决定 “哪些 行 排 在 当前 行 的 前 面 "， 就 本 例 
而 言 是 按照 HIREDATE 排序 。) 
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A.10 




















以 前 
的 员工 CLARK 开始 。 














(1) 首先 CLARK 的 工资 是 2450， 我 们 应 该 
并 找 出 来 相 加 求 和 。 但 是 ，CLARK 是 DE 
这 里 只 要 针对 CLARK 的 工资 2450 求 和 即 可 ， 这 就 是 上 述 查 询 结 果 中 第 














TOTAL 值 的 由 来 。 


Framing f fJ 


曾 查 询 的 结果 集 为 例 ， 我 们 来 具体 解释 一 下 Framing 子 句 的 工作 原理 ， 先 从 最 早 入 职 





巴 入 职 时 间 早 于 CLARK 的 所 有 员工 的 工资 一 
PTNO 等 于 10 的 部 门 中 最 早 入 职 的 员工 ， 因 此 
一 行 RUNNING_ 


(2) 按照 HIREDATE 排序 的 话 ， 下 一 个 员工 是 KING， 我 们 看 一 下 Framing 子 句 针对 他 做 了 


哪些 操作 。 


行 RUNNING_TOTAL 值 的 


(3) 按照 HIREDATE 排序 的 话 ， 分 区 中 最 后 一 


句 针 对 他 做 了 哪些 操 
开始 ， 在 此 之 前 的 行 
CLARK 和 KING 都 比 


他 们 两 个 人 的 工资 也 讨 
行 对 应 的 RUNNING TOTAL 值 的 由 来 。 


结果 中 MILLER 这 一 

















由 来 。 


/E, SAL 列 的 合计 运算 从 当 
数据 ( 





FAE: 2450+5000+1300, 











合计 运算 从 当前 行 的 工资 5000 (KING 的 工资 ) 开始 ， 在 此 之 前 的 行 数据 
(入 职 时 间 早 于 KING 的 员工 的 工资 ) 也 要 包括 在 内 。 入 职 时 间 比 KING 早 的 员工 只 
CLARK， 因 而 合计 值 就 是 5000 + 2450， 计 算 结果 是 7450， 这 就 是 上 述 查 询 结 果 中 第 二 


个 员工 是 MILLER， 我 们 再 看 一 下 Framing $ 


前 行 的 工资 1300 (MILLER 的 工资 ) 

















计算 结果 是 8750， 














如 上 所 述 ， 正 是 Framing 子 句 帮助 我 们 生成 了 累计 合计 值 。 除 了 规定 计算 的 顺序 


同时 也 指 


通常 而 言 ，Framing FAJR 


定 了 一 个 默认 的 请 动 窗口 。 


定义 动态 


变化 的 “数据 子 窗 口 ”， 并 





以 使 用 多 种 形式 的 语法 指定 数据 子 窗口 。 考 虑 如 下 所 示 的 查询 语句 。 


select deptno, 


ename, 
sal, 
sum(sal)over(order by hiredate 
range between unbounded preceding 
and current row) as run_totall, 
sum(sal)over(order by hiredate 
rows between 1 preceding 
and current row) as run_totaL2， 
sum(sal)over(order by hiredate 
range between current row 
and unbounded following) as run total3, 
sum(sal)over(order by hiredate 
rows between current row 
and 1 following) as run total4 
from emp 
where deptno-10 
DEPTNO ENAME SAL RUN TOTAL1 RUN TOTAL2 RUN TOTAL3 RUN TOTALA 
10 CLARK 2450 2450 2450 8750 7450 
10 KING 5000 7450 7450 6300 6300 
10 MILLER 1300 8750 6300 1300 1300 


, 





入 职 时 间 早 于 MILLER 的 员工 的 工资 ) 也 要 包括 在 内 。 
MILLER 入 职 时 间 早 ， 因 此 MILLER 对 应 的 RUNNING TOTAL 要 把 
这 就 是 上 述 查 


查询 


ORDER BY 


将 其 融入 聚合 运算 。 我 们 可 
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看 过 上 述 查 询 后 ， 你 可 能 会 感到 难以 理解 。 不 过 ， 其 实 它 并 不 是 多 么 难 理解 。RUN_TOTAL1 




















就 是 前 面 已 经 解释 过 的 Framing 子 句 UNBOUNDED PRECEDING AND CURRENT ROW。 下 面 我 们 解释 














一 下 其 他 几 个 Framing 子 句 。 




















(1) RUN_TOTAL2: 不 同 于 关键 字 RANGE， 此 处 的 Framing 子 句 使 用 了 Rows， 该 关键 字 表 明 将 
依据 指定 数目 的 行 记录 产生 出 请 动 窗口 。1 PRECEDING 表明 起 始 行 是 当前 行 前 面 的 那 一 
行 ， 因 而 对 应 的 范围 就 是 当前 行 以 及 排 在 它 前 面 的 那 一 行 。 因 此 ，RUN_TOTAL2 的 值 就 是 





























(2) RUN TOTAL3; RUN_TOTAL3 与 RUN TOTAL1 恰好 相反 ， 它 的 计算 范 目 


























后 面 的 所 有 行 ， 而 不 再 是 排 在 它 前 面 的 行 。 

















当前 员工 的 工资 加 上 依照 HIREDATE 排 在 他 前 面 的 那个 员工 的 工资 。 

"e 非常 凑巧 的 是 ， 此 处 CLARK 和 KING 对 应 的 RUN. TOTAL1 和 RUN, TOTAL2 具有 
相同 值 。 这 是 为 什么 呢 ? 不 妨 考虑 一 下 ， 对 于 这 两 个 员工 而 言 ， 哪 些 工 资 被 
a 分 别 计 入 了 以 上 两 种 累计 合计 值 。 仔 细 思 考 一 下 ， 你 应 











该 能 得 到 答案 。 














包括 当前 行 以 及 排 在 它 


("U 











(3) RUN_TOTAL4: 和 RUN_TOTAL2 恰好 相反 ， 该 累计 合计 值 的 计算 范围 包括 当前 行 和 排 在 它 











后 面 的 一 行 ， 而 不 是 排 在 前 面 的 一 行 。 


























=. 你 如 果 能 理解 到 目前 为 止 我 们 讲述 的 内 容 ， 那 么 应 该 也 都 能 领会 掌握 本 书 前 
aa 
nA 





面 给 出 的 各 个 实例 。 如 果 还 有 不 理解 的 地 方 ， 我 建议 你 基于 你 自己 构建 的 数 
Lk 据 和 查询 语句 多 加 练习 和 实践 。 我 的 个 人 经 验 表 明 ， 比 起 仅仅 阅读 别人 写 好 








的 查询 语句 ， 实 际 动手 写 一 些 代 码 可 能 更 有 助 于 我 们 掌握 一 种 新 技术 。 


A.11 最 后 一 个 关于 Framing 子 句 的 例子 


最 后 ， 我 们 再 来 看 一 个 展现 Framing 子 句 威力 的 例子 。 


select ename, 
sal, 
min(sal)over(order by sal) mini, 
max(sal)over(order by sal) maxi, 
min(sal)over(order by sal 
range between unbounded preceding 
and unbounded following) min2, 
max(sal)over(order by sal 
range between unbounded preceding 
and unbounded following) max2, 
min(sal)over(order by sal 
range between current row 
and current row) min3, 
max(sal)over(order by sal 
range between current row 
and current row) max3, 
max(sal)over(order by sal 
rows between 3 preceding 
and 3 following) max4 
from emp 
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WARD 1250 800 1250 800 5000 1250 1250 1500 
MARTIN 1250 800 1250 800 5000 1250 1250 1600 
MILLER 1300 800 1300 800 5000 1300 1300 2450 
TURNER 1500 800 1500 800 5000 1500 1500 2850 
ALLEN 1600 800 1600 800 5000 1600 1600 2975 
CLARK 2450 800 2450 800 5000 2450 2450 3000 
BLAKE 2850 800 2850 800 5000 2850 2850 3000 
JONES 2975 800 2975 800  À 5000 2975  Á 2975 5000 
SCOTT 3000 800 3000 800 5000 3000 3000 5000 
FORD 3000 800 3000 800 5000 3000 3000 5000 
KING 5000 800 X 5000 800 5000 5000 5000 5000 


我 们 把 上 述 查 询 结果 一 一 剖 开 来 看 。 





MIN1 

生成 该 字段 的 窗口 函数 并 没有 使 用 Framing 子 句 ， 因 此 等 价 于 使 用 了 默认 的 Framing F 

名 UNBOUNDED PRECEDING AND CURRENT ROW。 为 什么 全 部 结果 行 对 应 的 MIN1 都 是 800 呢 ? 

这 是 因为 最 低 工资 被 排 在 了 最 前 面 (ORDER BY SAL), ， 它 始终 是 最 小 值 。 

MAX1 

MAX1 的 值 就 和 MINI 大 不 相同 。 为 什么 呢 ? 原因 仍然 在 于 默认 的 Framing 子 句 UNBOUNDED 

PRECEDING AND CURRENT ROW。 由 于 使 用 了 ORDER BY SAL, iZ Framing 子 句 的 存在 使 得 最 高 

工资 始终 等 于 当前 行 对 应 的 工资 。 我 们 来 看 一 下 第 一 行 SMITH。 如 果 比 较 SMITH 的 

工资 和 排 在 他 前 面 的 工资 ， 我 们 会 发 现 SMITH 对 应 的 MAX1 其 实 就 应 该 是 SMITH 的 工 

资 ， 因 为 不 存在 排 在 他 之 前 的 员工 。 接 着 看 下 一 行 JAMES， 如 果 比 较 JAMES 的 工资 

和 排 在 他 前 面 的 工资 ， 我 们 发 现 和 SMITH 的 工资 相 比 较 的 话 ，JAMES 的 工资 较 高 ， 因 
ZR Xe rH e lE A MAX1 的 值 。 逐 一 比照 每 一 行 数据 做 一 遍 推演 ， 最 终 我 们 会 发 现 每 

一 行 对 应 的 MAX1 都 会 等 于 当前 员工 的 工资 。 

MIN2 和 MAX2 

这 两 列 对 应 的 Framing 子 句 都 是 UNBOUNDED PRECEDING AND UNBOUNDED FOLLOWING， 实 际 效 

果 等 同 于 将 圆 括号 置 空 。 国 数 MIN 和 MAX 的 作用 范围 是 整个 结果 集 。 因 此 ， 所 有 行 的 

MIN2 和 MAX2 值 都 将 是 相同 的 。 

MIN3 和 MAX3 

这 两 列 对 应 的 Framing 子 句 都 是 CURRENT ROW AND CURRENT ROW， 也 就 是 把 函数 MIN 和 MAX 

的 作用 范围 局 限于 当前 员工 的 工资 。 因 此 ，MIN3 和 MAX3 都 等 于 同一 行 的 SAL 值 。 这 一 

点 应 该 很 容易 理解 ， 对 吗 ? 

MAX4 

MAX4 对 应 的 Framing 子 句 是 3 PRECEDING AND 3 FOLLOWING， 这 表明 要 考虑 当前 行 的 前 3 

行 和 后 3 行 ， 当 然 也 包括 当前 行 本 身 。 这 样 ， 国 数 MAXCSAL) 的 调用 结果 就 是 对 应 这 些 

行 的 最 高 工资 。 















































































































































以 员工 MARTIN 对 应 的 MAX4 值 为 例 ， 





我 们 来 看 一 下 上 述 Framing 子 句 的 处 理 过 程 。 











MARTIN 的 工资 是 1230， 排 在 他 前 面 的 3 个 员工 的 工资 分 别 是 WARD (1250). ADAMS 
(1100) #H JAMES (950)。 排 在 他 后 面 的 3 个 员工 的 工资 分 别 是 MILLER (1300). 


TURNER (1500) 和 ALLEN (1600), # 


E MARTIN 的 工资 也 包括 在 内 ， 所 有 这 些 工资 中 





最 高 的 是 ALLEN 的 工资 ， 因 此 MARTIN 对 应 的 MAX4 是 1600。 


A.12 代码 可 读 性 + 性 能 = 威力 


总 之 ， 窗 口 国 数 非常 强大 ， 使 用 它 写 出 的 查询 语句 能 够 把 明细 数据 和 聚合 运算 结果 融 为 一 
体 。 相 比 于 使 用 多 个 自 连接 和 标量 子 查 询 ， 使 用 窗口 函数 的 代码 显得 短小 精 悍 。 我 们 来 看 
一 下 下 面 的 查询 语句 ， 它 很 容易 解决 如 下 问题 :“ 每 个 部 门 有 多 少 名 员工 ? 每 个 部 门 有 多 
少 个 不 同 职位 的 员工 ? (例如 ，DEPTNO 等 于 10 的 部 门 有 多 少 个 文员 。) EMP 表 中 总 共有 多 





























DAAT?” 
select deptno, 
job, 
count(*) over (partition by deptno) as emp_cnt, 
count(job) over (partition by deptno ,job) as job cnt, 
count(*) over () as total 
from emp 
DEPTNO JOB EMP. CNT JOB, CNT TOTAL 
10 CLERK 3 1 14 
10 MANAGER 3 1 14 
10 PRESIDENT 3 1 14 
20 ANALYST 5 2 14 
20 ANALYST 5 2 14 
20 CLERK 5 2 14 
20 CLERK 5 2 14 
20 MANAGER 5 1 14 
30 CLERK 6 1 14 
30 MANAGER 6 1 14 
30 SALESMAN 6 4 14 
30 SALESMAN 6 4 14 
30 SALESMAN 6 4 14 
30 SALESMAN 6 4 14 


如 果 不 想 使 用 窗口 国 数 ， 那 就 要 写 一 个 等 价 而 又 稍 显 麻烦 的 查询 语句 。 





select a.deptno, a.job, 
(select count(*) from emp b 


where b.deptno = a.deptno) as emp_cnt, 


(select count(*) from emp b 
where b.deptno = a.deptno 


and b.job = a.job) as job_cnt, 


(select count(*) from emp) as total 


from emp a 
order by 1,2 
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DEPTNO JOB EMP_CNT JOB_CNT TOTAL 


10 CLERK 3 1 14 
10 MANAGER 3 1 14 
10 PRESIDENT 3 1 14 
20 ANALYST 5 2 14 
20 ANALYST 5 2 14 
20 CLERK 5 2 14 
20 CLERK 5 2 14 
20 MANAGER 5 1 14 
30 CLERK 6 1 14 
30 MANAGER 6 1 14 
30 SALESMAN 6 4 14 
30 SALESMAN 6 4 14 
30 SALESMAN 6 4 14 
30 SALESMAN 6 4 14 





上 述 不 使 用 窗口 函数 的 方案 当然 不 是 很 麻烦 ， 但 是 它 的 代码 显得 不 够 简洁 、 高 效 。 因 为 
EMP RRA 14 行 数据 ， 这 里 无 论 如 何 反映 不 出 性 能 差异 ， 但 是 如 果 把 数据 规模 扩大 到 1000 
行 或 者 10000 行 的 话 ， 就 应 该 能 看 到 窗口 函数 的 效率 高 于 多 个 自 连接 和 标量 子 查询 。 


A.13 为 报表 查询 葛 定 基础 


除了 在 代码 可 读 性 和 性 能 方面 的 优势 ， 窗 口 函 数 还 为 更 加 复杂 的 “报表 风格 ”的 查询 奠定 
了 基础 。 例 如 ， 我 们 来 看 一 下 下 面 这 个 “报表 风格 ”的 查询 ， 它 先 在 一 个 内 租 视 图 中 使 用 
了 窗口 函数 ， 然 后 在 外 层 查询 中 展开 聚合 运算 。 有 了 窗口 函数 ， 我 们 能 同时 得 到 明细 数据 
和 聚合 运算 结果 ， 这 一 点 对 于 生成 报表 非常 有 帮助 。 下 面 的 这 个 查询 使 用 窗口 函数 计算 出 
了 多 种 不 同 分 区 的 计数 值 。 由 于 聚合 运算 的 作用 对 象 是 多 行 数据 ， 内 内 视图 将 返回 EMP 表 
中 所 有 行 ， 因 此 外 层 的 CASE 表达 式 能 够 进一步 做 形式 变换 ， 并 生成 格式 良好 的 报表 。 


select deptno, 

emp cnt as dept total, 
total, 
max(case when job = 'CLERK' 

then job cnt else 0 end) as clerks, 
max(case when job - 'MANAGER' 

then job cnt else 0 end) as mgrs, 
max(case when job - 'PRESIDENT' 

then job cnt else O end) as prez, 
max(case when job - 'ANALYST' 

then job cnt else © end) as anals, 
max(case when job - 'SALESMAN' 

then job cnt else © end) as smen 




















































































































from ( 
select deptno, 
job, 
count(*) over (partition by deptno) as emp cnt, 
count(job) over (partition by deptno,job) as job cnt, 
count(*) over () as total 
from emp 


)x 
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group by deptno, emp_cnt, total 


DEPTNO DEPT_TOTAL TOTAL CLERKS MGRS PREZ ANALS SMEN 


10 3 14 1 1 1 0 0 
20 5 14 2 1 0 2 0 
30 6 14 1 1 0 0 4 


上 述 查 询 返 回 了 所 有 部 门 ， 每 个 部 门 中 员工 总 人 数 ，EMP 表 中 员工 总 人 数 ， 以 及 每 个 部 门 
中 每 一 种 职位 各 有 多 少 个 员工 。 更 值得 注意 的 是 ， 只 要 一 个 查询 就 能 完成 所 有 这 些 工作 ， 
而 且 不 需要 用 到 任何 连接 查询 或 者 临时 表 。 


下 面 给 出 最 后 一 个 实例 ， 它 再 次 展示 了 使 用 窗口 函数 能 够 多 么 方便 地 同时 给 出 多 个 问题 的 
答案 


rro 





















































select ename as name, 
sal, 
max(sal)over(partition by deptno) as hiDpt, 
min(sal)over(partition by deptno) as loDpt, 
max(sal)over(partition by job) as hiJob, 
min(sal)over(partition by job) as loJob, 
max(sal)over() as hi, 
min(sal)over() as lo, 
sum(sal)over(partition by deptno 

order by sal,empno) as dptRT, 
sum(sal)over(partition by deptno) as dptSum, 
sum(sal)over() as ttl 
from emp 
order by deptno,dptRT 


NAME SAL HIDPT LODPT HIJOB LOJOB HI LO DPTRT DPTSUM TTL 
MILLER 1300 5000 31300 1300 800 5000 $800 1300 8750 29025 
CLARK 2450 5000 1300 2975 2450 5000 $800 3750 8750 29025 
KING 5000 5000 1300 5000 5000 5000 $800 à 8750 8750 29025 
SMITH 800 3000 à 800 31300 800 5000 800 800 10875 29025 
ADAMS | 1100 3000 800 1300 800 5000 $800 1900 10875 29025 
JONES 2975 3000 800 2975 2450 5000 800 4875 10875 29025 
SCOTT 3000 3000 800 3000 23000 5000 800 7875 10875 29025 
FORD 3000 23000 800 23000 23000 5000 $800 10875 10875 29025 
JAMES 950 2850 950 1300 800 5000 800 950 9400 29025 
WARD 1250 2850 950 1600 1250 5000 $800 2200 9400 29025 
MARTIN 1250 2850 950 1600 1250 5000 $800 3450 9400 29025 
TURNER 1500 2850 950 1600 1250 5000 $800 4950 9400 29025 
ALLEN 1600 2850 à 950 1600 1250 5000 800 6550 9400 29025 
BLAKE 2850 2850  À 950 2975 2450 5000 $800 9400 9400 29025 





上 述 查 询 简单 、 高 效 地 回答 了 下 列 几 个 问题 ， 并 且 保 持 了 很 好 的 代码 可 读 性 (其 至 没有 
使 用 额外 的 连接 查询 )。 它 只 需要 把 员工 及 其 工资 和 结果 集中 的 相对 应 的 行 数据 匹配 起 来 
即 可 。 


(1) 在 所 有 员工 中 谁 的 工资 最 高 (HI) ; 
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(2) 在 所 有 员工 中 谁 的 工资 最 低 (LO) ; 
(3) 在 每 个 部 门 里 谁 的 工资 最 高 (HIDPT) ; 
(4) 在 每 个 部 门 里 谁 的 工资 最 低 (LODPT) ; 


(5) 在 每 个 工作 种 类 里 谁 的 工资 最 高 (HIJOB) ; 
(6) 在 每 个 工作 种 类 里 谁 的 工资 最 低 (LOJOB) ; 





(7) 全 部 工资 的 合计 值 (TTL) ; 
(8) 每 个 部 门 工 资 的 合计 值 (DPTSUM) ; 
(9) 每 个 部 门 的 工资 累计 合计 值 (DPTRT)。 









































附录 B 
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附录 B 是 为 了 向 David Rozenshtein 致敬 。 我 在 前 言 部 分 说 过 ， 我 认为 他 的 作品 The 
Essence of SQL 即使 到 了 今天 仍然 是 最 棒 的 SQL 著作 。 这 本 只 有 119 RAE mE T RO 
目 中 一 个 SQL 程序 员 应 该 掌握 的 最 重要 的 知识 。 更 为 可 贵 的 是 ，David Rozenshtein 在 书 中 
向 我 们 展示 了 如 何 深 入 思考 一 个 问题 ， 并 最 终 找 到 解决 办 法 。 书 中 提供 的 解决 方案 具有 典 
型 的 面向 集合 思考 的 特征 。 或 许 在 实际 环境 中 由 于 表 的 体积 太 大 ， 我 们 无 法 照搬 书 中 提供 
的 解决 方案 ,但 它 提供 的 思路 非常 有 启发 性 ， 能 够 引导 我 们 基于 集合 的 思考 方式 去 探索 解 





决 方案 ， 而 不 是 陷入 过 程 化 的 迷 思 。 














The Essence of SQL 一 书 的 出 版 时 间 远 在 窗口 函数 和 MODEL 子 句 出 现 之 前 。 本 附录 会 尽量 利 




















用 标准 SQL 新 近 提 供 的 功能 为 这 本 和 





EE d 





的 一 些 问 题 找 日 


8 新 的 解决 方案 。( 至 于 这 些 解 








决 方案 是 否 优 于 旧 方 案 ， 需 要 根据 实际 情况 而 定 。) 在 每 一 个 讨论 部 分 的 最 后 ， 我 都 会 列 
出 The Essence of SOL 中 提供 的 解决 方案 。 部 分 示例 的 问题 可 能 会 在 The Essence of SOL 的 
基础 上 做 一 些 改动 ， 在 这 种 状况 下 ， 我 也 会 适当 地 修改 原 有 解决 方案 (改动 后 ,仍然 会 使 





用 和 原 解 决 方案 相似 的 做 法 和 技巧 )。 


B.1 示例 表 和 数据 

















下 面 的 表 都 来 自 The Essence of SOL 一 书 ， 本 附录 后 面 的 实例 会 用 到 它们 。 











/* student 表 */ 
create table student 


( sno integer, 
sname varchar(10), 
age integer 

) 
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/* courses 表 */ 
create table courses 


( cno varchar(5), 
title varchar(10), 
credits integer 

) 


/* professor */ 
create table professor 


( lname varchar(10), 
dept varchar(10), 
salary integer， 
age integer 

) 





/* student 表 和 学 生 选 修 的 课程 */ 


create table take 
( sno integer, 
cno varchar(5) 


) 


/* professor 表 和 教授 所 讲 的 课程 */ 


create table teach 
( lname varchar(10), 
cno varchar(5) 


) 


insert into student values 
insert into student values 
insert into student values 
insert into student values 
insert into student values 
insert into student values 
insert into student values 
insert into student values 
insert into student values 
insert into student values 


insert into courses values 
insert into courses values 
insert into courses values 


insert into professor values 
insert into professor values 
insert into professor values 
insert into professor values 
insert into professor values 


insert into take values (1, 
insert into take values (1, 
insert into take values (1, 
insert into take values (2, 
insert into take values (3, 
insert into take values (3, 


(1, 'AARON' ,20) 
(2,' CHUCK' ,21) 
(3,'DOUG' ,20) 
(4, 'MAGGIE' ,19) 
(5,'STEVE' ,22) 
(6, ' JING' ,18) 
(7, 'BRIAN' ,21) 
(8,'KAY' ,20) 
(9,'GILLIAN',20) 
(10, 'CHAD' ,21) 


('CS112','PHYSICS',4) 
('CS113','CALCULUS ' ,4) 
('CS114', 'HISTORY',4) 


('CHOI','SCIENCE',400,45) 
(' GUNN' , 'HISTORY' ,300,60) 
('MAYER' , ' MATH' , 400,55) 
('POMEL' , 'SCIENCE',500,65) 
('FEUER' , ' MATH' , 400,40) 


'CS112") 
'CS113") 
'CS114") 
'CS112") 
'CS112") 
'CS114") 
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insert into take values (4,'CS112') 
insert into take values (4,'CS113') 
insert into take values (5,'CS113') 
insert into take values (6,'CS113') 
insert into take values (6,'CS114') 


insert into teach values ('CHOI','CS112') 
insert into teach values ('CHOI','CS113') 
insert into teach values ('CHOI','CS114') 
insert into teach values ('POMEL','CS113') 
insert into teach values ('MAYER','CS112') 
insert into teach values ('MAYER','CS114') 


B.2 ”逻辑 否定 问题 

David Rozenshtein 在 The Essence of SQL 一 书 中 提出 了 各 种 类 型 的 基础 问题 ， 以 此 来 考察 
你 对 SQL 的 掌握 程度 。 “e Miei e 到 以 这 样 或 那样 的 形式 出 现 的 这 类 问 
题 。 逻 辑 否 定 就 是 其 中 一 种 。 我 们 经 常 需要 找 出 不 符合 某 些 特定 条 件 的 行 。 如 果 查 询 条 件 
简单 ， 自 然 很 容易 解决 。 但 入 如 下 面 的 例子 所 展现 的 屠 榜 ， 有 一 些 逻 辑 否 定 问 题 确 实 要 求 
我 们 加 入 一 点 创造 性 的 思考 才能 解决 。 









































B.2.1 问题 1 
你 希望 找 出 没有 选修 过 cs112 课程 的 学 生 ， 但 下 面 的 查询 语句 返回 的 结果 却 是 错误 的 。 


select * 
from student 
where sno in ( select sno 
from take 
where cno != 'CS112' ) 


一 个 学 生 可 能 会 选修 多 门 课程 ， 而 以 上 查询 却 有 可 能 把 选修 了 Cs112 的 学 生 也 提取 出 来 。 
该 查询 之 所 以 不 正确 ， 是 因为 它 没有 正确 回答 问题 :;“ 谁 没有 选修 CS112 ? ”实际 上 ， 它 回 
答 的 问题 是 :“ 谁 选修 了 C5112 之 外 的 课程 ? ”正确 的 结 ro ome 
学 生 ， 以 及 选修 了 一 些 课程 却 没 有 选 CS112 的 学 生 。 最 终 ， 你 希望 得 到 如 下 所 示 的 结果 集 。 





























SNO SNAME AGE 
5 STEVE 22 
6 JING 18 
7 BRIAN 21 
8 KAY 20 
9 GILLIAN 20 
10 CHAD 21 
MySQL 和 PostgreSQL 


使 用 CASE 表达 式 和 聚合 函数 MAX 标识 一 个 学 生 是 否 选 修了 C5112 课程 。 


1 select s.sno,s.sname,s.age 
2 from student s left join take t 
3 on (s.sno = t.sno) 
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4 group by s.sno,s.sname,s.age 
5 having max(case when t.cno = 'CS112' 
6 then 1 else 0 end) = 0 


DB2 和 SQL Server 
使 用 CASE 表达 式 和 窗口 函数 MAX OVER 标识 一 个 学 生 是 否 选 修了 CS112 课程 。 





1 select distinct sno,sname,age 

2 from ( 

3 select s.sno,s.sname,s.age, 

4 max(case when t.cno = 'CS112' 

5 then 1 else 0 end) 

7 over(partition by s.sno,s.sname,s.age) as takes_CS112 
9 from student s, take t 

10 on (s.sno = t.sno) 

11 ) x 

12 where takes_CS112 = 0 


Oracle 
对 于 Oracle 9i 及 其 后 续 版 本 ， 上 述 DB2 解决 方案 也 适用 。 除 此 之 外 ， 还 可 以 使 用 Oracle 
专 有 的 外 连接 语法 ，Oracle 8i 或 更 早 版 本 则 只 能 使 用 该 语法 。 


/* group by 解决 方案 */ 








1 select s.sno,s.sname,s.age 

2 from student s, take t 

3 where s.sno = t.sno (+) 

4 group by s.sno,s.sname,s.age 
5 having max(case when t.cno = 'CS112' 

6 then 1 else 0 end) = 0 





/* 窗口 函数 解决 方案 */ 


1 select distinct sno,sname,age 

2 from ( 

3 select s.sno,s.sname,s.age, 

4 max(case when t.cno = 'CS112' 

5 then 1 else 0 end) 

7 over(partition by s.sno,s.sname,s.age) as takes_CS112 
9 from student s, take t 

10 where s.sno = t.sno (+) 

11 ) x 

12 where takes CS112 = 0 


讨论 
以 上 几 种 解决 方案 的 语法 各 有 不 同 ， 但 其 做 法 并 无 二 致 。 这 里 用 到 的 技巧 是 ， 在 结果 集中 
创建 一 个 “布尔 ” 列 来 表示 学 生 是 否 选修 了 CS112 课程 。 如 果 一 个 学 生 选 修了 csii2, JE 
么 该 列 的 值 为 1， 否则， 为 0。 下 面 的 查询 把 CASE 表达 式 移 到 了 SELECT 列表 里 ， 并 把 中 间 
结果 打印 出 来 。 

select s.sno,s.sname,s.age, 


case when t.cno = 'CS112' 
then 1 
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else 0 
end as takes_CS112 
from student s left join take t 
on (s.sno-t.sno) 


SNO SNAME AGE TAKES CS112 
1 AARON 20 1 
1 AARON 20 0 
1 AARON 20 0 
2 CHUCK 21 1 
3 DOUG 20 1 
3 DOUG 20 0 
4 MAGGIE 19 1 
4 MAGGIE 19 0 
5 STEVE 22 0 
6 JING 18 0 
6 JING 18 0 
8 KAY 20 0 

10 CHAD 21 0 
7 BRIAN 21 0 
9 GILLIAN 20 0 


外 连接 到 TAKE REH T MRE UE VERG TE (TURREBS EIE EU ORE ilk, 2383518) 
MAX 函数 找 出 最 大 的 CASE 表达 式 返 回 值 。 如 果 一 个 学 生 选 修了 C5112 课程 ， 最 大 值 会 是 1， 
因为 其 他 课程 对 应 的 值 都 是 0。 对 于 GROUP BY 解决 方案 而 言 ， 最 后 一 步 借 助 HAVING FAs 
选 出 MAX/CASE 表达 式 返 回 值 等 于 0 的 学 生 。 对 于 窗口 函数 解决 方案 ， 我 们 需要 把 上 面 的 查 
询 放 入 一 个 内 租 视 图 ， 并 在 外 层 查 询 中 引用 TAKES_CS112， 因 为 WHERE 子 句 不 能 引用 窗口 函 
数 的 查询 结果 。 另 外 ， 根 据 窗口 函数 的 工作 原理 ， 这 里 也 必须 剔除 掉 重 复 的 课程 。 
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原 解 决 方案 
The Essence of SQL 一 书 中 对 于 本 问题 的 解决 方案 非常 巧妙 ， 如 下 所 示 。 
select * 


from student 
where sno not in (select sno 
from take 
where cno = 'CS112') 


我 们 可 以 这 么 理解 其 思路 :“ 在 TAKE 表 中 找 出 选修 CS112 课程 的 学 生 ， 然 后 从 STUDENT 表 
中 找 出 不 在 其 中 的 学 生 。” 该 做 法 遵从 了 David Rozenshtein 在 该 书 的 最 后 部 分 给 出 的 有 关 
逻辑 否定 的 建议 :“ 要 记 住 真正 的 逻辑 否定 要 求 两 个 步骤 ， 即 为 了 找 出 “哪些 人 不 是 GE 
要 先 找 出 “哪些 人 是 ， 然 后 再 排除 掉 他 们 。 

















B.2.2 问题 2 
你 希望 找 出 只 选修 了 C5112 和 cs114 中 的 一 门 ， 而 不 是 两 门 都 选 的 学 生 。 下 面 的 查询 语句 
看 似 有 道理 ， 但 返回 的 结果 集 却 不 对 。 


select * 
from student 
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where sno in ( select sno 


from take 
where cno != 'CS112' 
and cno != 'CS114' ) 








选修 了 至 少 一 门 课程 的 学 生 里 面 ， 只 有 DOUG 和 AARON 同时 选 了 csii2 和 CS114。 这 两 
个 学 生 应 该 被 排除 在 外 。 学 生 STEVE 选修 了 CS113， 但 既 不 是 CS112， 也 不 是 CS114， 所 
以 也 应 该 被 排除 在 外 。 


因为 一 个 学 生 会 选修 多 门 课程 ， 在 这 里 我 们 应 该 为 每 个 学 生 只 返回 一 行 记录 ， 并 创建 一 个 
字段 用 于 标记 该 学 生 是否 选 了 CS112 或 CS114， 或 者 同时 选 了 这 两 门 课程 。 这 种 做 法 使 得 
我 们 能 够 很 容易 确认 一 个 学 生 是 否 同时 选修 了 这 两 门 课程 ， 并 且 不 必 多 次 扫描 原 表 数据 。 
最 终 的 结果 集 如 下 所 示 。 


























SNO SNAME AGE 

2 CHUCK 21 

4 MAGGIE 19 

6 JING 18 
MySQL 和 PostgreSQL 








使 用 CASE 表达 式 和 聚合 函数 SUM 找 出 选修 C112 或 CS114， 但 又 没有 同时 选 这 两 门 课程 的 


1 select s.sno,s.sname,s.age 

2 from student s, take t 

3 where s.sno = t.sno 

4 group by s.sno,s.sname,s.age 
5 having sum(case when t.cno in ('CS112','CS114') 
6 then 1 else 0 end) = 1 


DB2. Oracle 和 SQL Server 
使 用 CASE 表达 式 和 窗口 国 数 SUM OVER 找 出 选修 了 CS112 或 CS114， 但 又 没有 同时 选 这 两 门 
课程 的 学 生 。 
1 select distinct sno,sname ,age 
2 from ( 
3 select s.sno,s.sname,s.age, 
4 sum(case when t.cno in ('CS112','CS114') then 1 else 0 end) 
5 over (partition by s.sno,s.sname,s.age) as takes either or 
6 
7 
8 
9 


from student s, take t 
where s.sno = t.sno 


)x 
where takes_either_or = 1 
讨论 
解决 本 问题 的 第 一 步 是 ， 内 连接 STUDENT 表 和 TAKE 表 ， 这 样 就 排除 了 那些 没有 选修 任何 课 
程 的 学 生 。 接 着 使 用 CASE 表达 式 标记 一 个 学 生 是 否 选修 了 这 两 门 课程 中 的 一 门 。 在 下 面 的 
查询 语 名 里， 我们 把 CASE 表达 式 移入 到 SELECT 列表 里 ， 并 且 打 印 出 中 间 结 果 。 


select s.sno,s.sname,s.age, 
case when t.cno in ('CS112','CS114') 
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then 1 else 0 end as takes either or 
from student s, take t 
where s.sno = t.sno 


SNO SNAME AGE TAKES EITHER OR 
1 AARON 20 1 
1 AARON 20 0 
1 AARON 20 1 
2 CHUCK 21 1 
3 DOUG 20 1 
3 DOUG 20 1 
4 MAGGIE 19 1 
4 MAGGIE 19 0 
5 STEVE 22 0 
6 JING 18 0 
6 JING 18 1 


TAKES EITHER OR 值 等 于 1， 表 示 该 学 生 选 修了 Cs112 或 者 CS114。 因 为 一 个 学 生 可 以 选修 
多 门 课 程 ， 下 一 步 要 使 用 GROUP BY 和 聚合 函数 SUM 为 每 个 学 生 返 回 一 行 记 录 。 函 数 SUM 会 
把 每 个 学 生 对 应 的 1 都 累加 起 来 。 





select s.sno,s.sname,s.age, 
sum(case when t.cno in ('CS112','CS114') 
then 1 else 0 end) as takes either or 
from student s, take t 
where s.sno - t.sno 
group by s.sno,s.sname,s.age 


SNO SNAME AGE TAKES EITHER OR 
1 AARON 20 2 
2 CHUCK 21 1 
3 DOUG 20 2 
4 MAGGIE 19 1 
5 STEVE 22 0 
6 JING 18 1 


既 没 有 选修 CS112 也 没有 选 CS114 的 学 生 对 应 的 TAKES. EITHER OR 值 是 0。 同 时 选 了 CS112 
和 CS114 的 学 生 对 应 TAKES EITHER OR 值 是 2。 我 们 希望 保留 TAKES_EITHER_OR 值 等 于 1 的 
学 生 。 最 终 的 解决 方案 使 用 HAVING 子 句 得 选 出 TAKES. EITHER. OR 值 等 于 1 的 学 生 。 

对 于 窗口 函数 解决 方案 ， 具体 做 法 也 类 似 。 这 里 同样 需要 把 上 述 查 询 放 入 内 柚 视图 里 ， 然 
后 在 外 层 查询 中 引用 TAKES_EITHER_OR 列 ， 因 为 不 能 直接 在 WHERE 子 句 中 引用 窗口 函数 。 


— 

















在 SQL 处 理 过 程 中 ， 窗 口 国 数 是 最 后 被 评估 执行 的 部 分 ， 但 会 先 于 ORDER BY 子 句 执行 。) 
另外 ， 根 据 窗口 函数 的 工作 原理 ， 这 里 也 必须 剔除 掩 重复 的 课程 。 

















原 解决 方案 





F 








i 的 查询 语句 是 The Essence of SOL 一 书 中 的 解决 方案 〈 略 有 改动 )。 该 查询 和 问题 1 中 





的 原 解 决 方案 的 做 法 相同 ， 都 非常 巧妙 。 该 解决 方案 使 用 自 连 接 找 出 同时 选修 了 cs112 和 
CS114 的 学 生 ， 然 后 使 用 子 查 询 从 选修 了 csii2 或 CS114 的 学 生 中 把 同时 选 了 两 门 的 学 生 易 
除 掉 。 
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select * 
from student s, take t 
where s.sno = t.sno 
and t.cno in ( 'CS112', 'CS114' ) 
and s.sno not in ( select a.sno 
from take a, take b 
where a.sno - b.sno 
and a.cno = 'CS112' 
and b.cno 'CS114' ) 


B.2.3 问题 3 


你 希望 找 出 选修 了 CS112， 而 且 没 有 选修 其 他 课程 的 
不 正确 。 


select s.* 
from student s, take t 
where s.sno = t.sno 
and t.cno = 'CS112' 














CHUCK 是 唯一 选修 了 Cs112， 而 且 设 有 选修 其 他 课程 的 学 生 
上 述 查 询 筛选 出 








本 问题 可 以 被 理解 为 “ 找 出 只 选修 了 csii2 的 学 生 ”。 

















只 选修 了 一 门 课 程 ， 才 B 且 这 门 课 是 CS112” ° 


e 和 PostgreSQL 
使 用 聚合 函数 COUNT 确保 下 列 查 询 返 回 的 学 生 只 选修 











1 select s.* 

2 from student s, 

3 take t1, 

4 ( 

5 select sno 

6 from take 

7 group by sno 

8 having count(*) = 1 


9 ) t2 

10 where s.sno = tl.sno 
11 and t1.sno = t2.sno 
12 and t1.cno = 'CS112' 


DB2, Oracle 和 SQL Server 
使 用 窗口 函数 COUNT OVER 确保 下 列 查询 返回 的 学 生 只 





1 select sno,sname,age 

2 from ( 

3 select s.sno,s.sname,s.age,t.cno, 

4 count(t.cno) over ( 

5 partition by s.sno,s.sname,s.age 
6 ) as cnt 

7 from student s, take t 

8 where s.sno - t.sno 





学 生 ， 但 下 面 的 查询 语句 返回 











了 一 门 课程 。 





选修 了 一 门 课程 。 





述 查 询 应 该 只 返 





的 


结果 


回 CHUCK。 


了 选修 C5112 的 学 
^E, 但 同时 选 了 其 他 课程 的 学 生 也 会 被 一 并 返回 。 正 确 的 查询 语句 回答 的 问题 应 该 是 “ 谁 
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9 ) x 
10 where cnt 
11 and cno 


讨论 
本 解决 方案 的 关键 要 写 一 个 查询 来 回答 这 两 个 问题 :“ 哪 些 学 生 只 选修 了 一 门 课程 ?““ 哪 
些 学 生 选 修了 CS112 课程 ? ”第 一 种 解决 方案 使 用 内 藤 视 图 T2 找 出 只 选修 了 一 门 课程 的 学 
生 。 接 着 连接 内 和 骨 视图 T2 到 TAKE 表 ， 并 且 筛 选 出 选修 CS112 课程 的 学 生 。( 这 样 一 来 ， 剩 
下 的 就 是 只 选修 一 门 课程 并 且 那 门 课程 是 CS112 的 学 生 。) 下 面 的 查询 给 出 了 到 目前 为 止 的 
结果 。 

select t1.* 

from take t1, 


( 
select sno 
from take 
group by sno 
having count(*) = 1 


'CS112' 


























) t2 
where t1.sno = t2.sno 
and t1.cno = 'CS112' 
SNO CNO 
2 CS112 





Be), EV BTE] T2 和 TAKE 表 连 接 查询 的 基础 上 再 次 连接 STUDENT 表 ， 找 出 匹配 的 学 
生 。 上 述 窗 口 函 数 解 决 方案 也 采取 了 类 似 的 做 法 ， 但 是 处 理 方式 上 稍 有 不 同 (更 有 效率 )。 
内 瞬 视图 X 返 回 了 每 一 个 学 生 、 他 们 选修 的 课程 以 及 他 们 选修 了 几 门 课程 。(TAKE 表 和 
STUDENT 表 之 间 的 内 连接 确保 没有 选修 任何 课程 的 学 生 会 被 剔除 掉 。) 结果 集 如 下 所 示 。 


select s.sno,s.sname,s.age,t.cno, 
count(t.cno) over ( 
partition by s.sno,s.sname,s.age 
) as cnt 
from student s, take t 
where s.sno = t.sno 









































SNO SNAME AGE CNO CNT 
1 AARON 20 CS112 3 
1 AARON 20 CS113 3 
1 AARON 20 CS114 3 
2 CHUCK 21 CS112 1 
3 DOUG 20 CS112 2 
3 DOUG 20 CS114 2 
4 MAGGIE 19 CS112 2 
4 MAGGIE 19 CS113 2 
5 STEVE 22 CS113 1 
6 JING 18 CS113 2 
6 JING 18 CS114 2 





508 | 附录 B 


获得 了 每 个 学 生 选 修 的 课程 和 课程 数目 之 后 ， 最 后 只 要 保留 CNT 等 于 1 并 且 CNO 等 于 
CS112 的 行 即 可 。 
原 解 决 方案 
The Essence of SOL 一 书 中 的 解决 方案 使 用 了 子 查询 和 双重 否定 。 

select s.* 

from student s, take t 
where s.sno = t.sno 
and s.sno not in ( select sno 


from take 
where cno != 'CS112' ) 


这 是 一 个 非常 巧妙 的 解决 方案 ， 上 述 查 询 既 没有 计算 每 个 学 生 选 修了 几 门 课程 ， 也 没有 设 
置 过 滤 条 件 确 保 查询 返回 的 学 生 选 修了 CS112。 那 么 ， 它 是 怎么 做 到 的 呢 ? 其 中 的 子 查 询 
负责 找 出 至 少 选修 了 一 门 课 ， 但 又 疫 有 选修 CS112 的 所 有 学 生 ， 结 果 集 显示 如 下 。 

select sno 


from take 
where cno != 'CS112' 

















SNO 


1 
Oo 3 b QO P P S : 


NL 





层 查 询 负责 找 出 选修 了 一 门 课程 (任意 课程 )， 并 且 不 在 上 述 子 查询 的 返回 结果 的 学 生 。 
先 忽略 外 层 查 询 里 的 NOT IN 部 分 ， 我 们 能 看 到 如 下 所 示 的 中 间 结 果 集 (打印 出 了 所 有 至 少 
选修 了 一 门 课程 的 学 生 )。 

select s.* 


from student s, take t 
where s.sno = t.sno 














SNO SNAME AGE 
1 AARON 20 
1 AARON 20 
1 AARON 20 
2 CHUCK 21 
3 DOUG 20 
3 DOUG 20 
4 MAGGIE 19 
4 MAGGIE 19 
5 STEVE 22 
6 JING 18 
6 JING 18 
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如 果 仔 细 比 较 上 述 两 个 结果 集 ， 我 们 就 会 发 现 外 层 查询 的 NOT IN 实际 上 执行 了 差 集运 
算 ， 用 外 层 查 询 得 到 的 SNO 减 去 子 查询 的 SN0， 结 果 只 剩 下 SNO 等 于 2 的 学 生 。 总 之 ， 子 
查询 负责 找 出 没有 选修 CS112 课程 的 学 生 。 外 层 查 询 负责 找 出 不 属于 上 述 子 查 询 返回 结果 
集 的 学 生 。( 这 样 剩 下 的 学 生 就 是 只 选修 cs112 课程 的 学 生 且 没有 选修 任何 课程 的 学 生 。) 
STUDENT 表 和 TAKE 表 之 间 的 连接 操作 过 滤 掉 没有 选修 任何 课程 的 学 生 ， 只 留 下 选修 CS112 
课程 并 且 只 选修 C5112 课程 的 学 生 。 这 就 是 面向 集合 的 思考 和 解决 问题 的 方法 。 


B.3 At Most 条 件 问 题 


At Most 条 件 问题 是 另 一 种 我 们 可 能 经 常 遇 到 的 查询 问题 。 筛 选 出 满足 某 个 条 件 的 行 并 不 
难 ， 但 有 时 候 我 们 还 需要 限定 符合 条 件 的 行 的 数目 ， 这 又 该 如 何 处 理 呢 ? 下 面 的 两 个 实例 
都 与 此 类 问题 相关 。 















































B.3.1 问题 4 

你 希望 找 出 最 多 选修 两 门 课程 的 学 生 ， 没 有 选修 任何 课程 的 学 生 应 该 被 排除 在 外 。 全 体 学 
生 中 ， 只 有 AARON 选修 的 课程 数目 超过 两 门 ， 他 应 该 被 排除 在 外 。 最 终 你 希望 得 到 如 下 
所 示 的 结果 集 。 


























SNO SNAME AGE 

2 CHUCK 21 

3 DOUG 20 

4 MAGGIE 19 

5 STEVE 22 

6 JING 18 
MySQL 和 PostgreSQL 


使 用 聚合 函数 COUNT 判断 哪些 学 生 最 多 选修 了 两 门 课 程 。 


1 select s.sno,s.sname,s.age 

2 from student s, take t 

3 where s.sno = t.sno 

4 group by s.sno,s.sname,s.age 
5 having count(*) <= 2 


DB2, Oracle 和 SQL Server 
再 次 使 用 窗口 函数 COUNT OVER 判断 哪些 学 生 最 多 选修 了 两 门 课程 。 


1 select distinct sno,sname,age 

2 from ( 

3 select s.sno,s.sname,s.age, 

4 count(*) over ( 

5 partition by s.sno,s.sname,s.age 
6 ) as cnt 

7 from student s, take t 

8 where s.sno = t.sno 





注 1: 意 为 “最 多 XX 个 ”“ 不 超过 XX 个 ”。 一 一 译 者 注 
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9 )x 
10 where cnt <= 2 
讨论 
以 上 两 种 解决 方案 的 思路 都 是 计算 出 TAKE 表 中 每 个 SNO 出 现 的 次 数 。STUDENT 表 和 TAKE 表 
的 内 连接 操作 能 够 确保 剔除 掉 没 有 选修 任何 课程 的 学 生 。 
原 解决 方案 
The Essence of SQL 一 书 使 用 了 聚合 函数 解决 方案 ， 如 MySQL 和 PostgreSQL 解决 方案 所 
示 。 同 时 ，David Rozenshtein 也 提供 了 另 一 个 替代 方案 ， 该 方案 中 使 用 了 两 次 自 连接 ， 如 
下 所 示 。 
select distinct s.* 
from student s, take t 
where s.sno = t.sno 
and s.sno not in ( select tl.sno 
from take ti, take t2, take t3 
where tl.sno = t2.sno 
and t2.sno - t3.sno 


and ti.cno < t2.cno 
and t2.cno « t3.cno ) 


上 述 这 种 两 次 自 连接 的 解决 方案 很 巧妙 ， 因 为 它 避 免 了 聚合 运算 。 下 面 来 解释 该 做 法 的 原 
理 ， 先 看 一 下 子 查 询 的 WHERE 子 句 。 基 于 SNO 的 内 连接 操作 能 够 确保 子 查 询 返回 的 每 一 行 
都 是 针对 同一 个 学 生 的 数据 。 那 个 比较 cNo 的 条 件 用 来 判断 一 个 学 生 选 修 的 课程 数量 是 否 
多 于 两 门 。 子 查询 的 WHERE 子 句 可 以 这 么 表述 :“ 对 于 每 一 个 学 生 ， 只 返回 第 一 个 CNO 小 于 
第 二 个 CNO 并 且 第 二 个 CNO 小 于 第 三 个 CNO 的 行 。” 如 果 一 个 学 生 选 修 的 课程 数量 小 于 3, 
那么 该 条 件 不 会 为 真 ， 因 为 没有 第 3 个 CN0。 也 就 是 说 ， 子 查询 就 是 为 了 找 出 选修 了 3 门 
以 上 课程 的 学 生 。 外 层 查 询 则 负责 返回 至 少 选修 了 一 门 课程 ， 并 且 SNO 不 存在 于 子 查 询 返 
回 结 果 的 学 生 。 



























































B.3.2 问题 5 


你 希望 找 出 年 龄 最 多 大 于 其 他 两 名 同学 的 学 生 。 也 就 是 说 ， 本 问题 就 是 要 找 出 那些 比 其 他 
0 个 、1 个 或 者 2 个 学 生年 龄 大 的 学 生 。 最 终 的 结果 集 应 该 如 下 所 示 。 





SNO SNAME AGE 
6 JING 18 
4 MAGGIE 19 
1 AARON 20 
9 GILLIAN 20 
8 KAY 20 
3 DOUG 20 
MySQL 和 PostgreSQL 





使 用 聚合 函数 COUNT 和 关联 子 查询 找 出 比 其 他 0 个 、1 个 或 2 个 学 生年 龄 大 的 学 生 。 


1 select s1.* 
2 from student s1 
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3 where 2 >= ( select count(*) 
4 from student s2 
5 where s2.age <sl.age ) 


DB2. Oracle 和 SQL Server 
使 用 窗口 函数 DENSE_RANK 找 出 比 其 他 0 个 、1 个 或 2 个 学 生年 龄 大 的 学 生 。 


1 select sno,sname,age 

2 from ( 

3 select sno,sname,age, 

4 dense rank()over(order by age) as dr 
5 

6 

7 








from student 
) x 


where dr <= 3 
讨论 
聚合 国 数 解决 方案 使 用 标量 子 查询 筛选 出 最 多 比 其 他 两 名 学 生年 龄 大 的 学 生 。 我 们 把 上 述 
解决 方案 改写 一 下 ， 添 加 一 个 标量 子 查询 ， 这 样 你 就 容易 理解 其 工作 原理 了 。 如 下 所 示 的 
实例 中 ，CNT 列 代 表 年 龄 比 当 前 学 生 小 的 学 生 人 数 。 
select s1.*, 
(select count(*) from student s2 


where s2.age < sl.age) as cnt 
from student s1 




















order by 4 

SNO SNAME AGE CNT 
6 JING 18 0 
4 MAGGIE 19 1 
1 AARON 20 2 
3 DOUG 20 2 
8 KAY 20 2 
9 GILLIAN 20 2 
2 CHUCK 21 6 
7 BRIAN 21 6 
10 CHAD 21 6 
5 STEVE 22 9 





看 过 上 面 的 查询 结果 ， 我 们 就 能 明白 最 终结 果 集 是 那些 CNT 值 小 于 或 等 于 2 的 学 生 。 
使 用 窗口 函数 DENSE_RANK 的 解决 方案 也 类 似 于 上 面 的 相关 子 查 询 方案 ， 它 根据 有 多 少 人 比 
当前 学 生年 龄 小 计算 出 每 个 学 生 对 应 的 排名 (DENSE_RANK PILY Tie 的 存在 ， 还 能 保证 
名 次 连续 ， 中 间 不 留 空白 )。 下 面 的 查询 展示 了 DENSE RANK 函数 的 输出 结果 。 

select sno,sname,age, 


dense_rank()over(order by age) as dr 
from student 























SNO SNAME AGE DR 
6 JING 18 1 
4 MAGGIE 19 2 
1 AARON 20 3 
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3 DOUG 20 3 

8 KAY 20 3 

9 GILLIAN 20 3 

2 CHUCK 21 4 

7 BRIAN 21 4 

10 CHAD 21 4 

5 STEVE 22 5 
Be) EXSAETRRCA — SAREE, JE PAR RAIE DR 值 小 于 或 等 于 3 的 行 。 
原 解 决 方案 


The Essence of SOL 一 书 采取 了 一 种 有 趣 的 解决 办 法 ， 那 就 是 重新 表述 问题 。 不 去 “ 找 上 


[|] Ei 
OH 





多 比 两 位 学 生年 龄 大 的 学 生 "， 而 是 “ 找 出 那些 比 其 他 3 个 或 更 多 (至少 3 个 ) 学 生年 龄 




















小 的 学 生 。 如 果 你 希望 学 习 面 向 集合 思考 的 问题 解决 方法 ， 那 么 The Essence of SOL 一 书 























为 我 们 做 了 一 次 非常 精彩 的 示范 ， 它 强迫 我 们 通过 下 面 的 两 个 步骤 找到 解决 方案 。 


(D 找 出 比 其 他 3 个 或 更 多 学 生年 龄 大 的 学 生 集合 。 
(2) 返回 不 存在 于 上 一 步 结果 集 的 学 生 。 


解决 方案 如 下 所 示 。 


select * 
from student 
where sno not in ( 
select sl.sno 
from student s1, 
student s2, 
student s3, 
student s4 
where sl.age > s2.age 
and s2.age > s3.age 
and s3.age > s4.age 


) 

SNO SNAME AGE 
6 JING 18 
4 MAGGIE 19 
1 AARON 20 
9 GILLIAN 20 
8 KAY 20 
3 DOUG 20 














如 有 果 自 下 而 上 仔细 观察 上 述 解 决 方案 ， 我 们 会 发 现 它 先 执行 的 是 “ 找 出 比 其 他 3 个 或 更 多 





学 生年 龄 大 的 学 生 集合 ”， 如 下 所 示 。 (为 提高 可 读 性 ， 使 用 DISTINCT 压缩 结果 集 。) 


select distinct s1.* 

from student s1, 
student s2, 
student s3, 
student s4 

where sl.age > s2.age 

and s2.age > s3.age 

and s3.age > s4.age 
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SNO SNAME AGE 


2 CHUCK 21 
5 STEVE 22 
7 BRIAN 21 
10 CHAD 21 


看 到 上 述 自 连接 查询 ， 你 可 能 感到 迷惑 不 解 ， 我 们 不 妨 先 来 分 析 一 下 WHERE 子 句 。S1.AGE 
比 S2.AGE 大 ， 因 此 任何 一 个 学 生 ， 只 有 他 至 少 比 一 个 学 生年 龄 大 ， 才 可 能 会 被 保留 下 来 。 
接 下 来 ，S2.AGE 比 53.AGE 大 ， 则 年 龄 大 于 其 他 两 个 学 生 的 学 生 会 被 保留 下 来 。 注 意 ， 大 
于 具有 传递 性 。 如 果 S1.AGE LE S2.AGE 大 ， 并 且 S2.AGE FE S3.AGE K, HBA S1.AGE 当然 也 
LE S3.AGE 大 。 一旦 理解 了 这 一 点 ， 我 们 就 可 以 把 上 述 查 询 简 化 到 只 有 一 个 自 连 接 ， 从 而 更 
便于 我 们 理解 每 一 步 操作 的 输出 结果 。 例 如 ， 找 出 至 少 比 一 个 学 生年 龄 大 的 学 生 。( 除 了 
年 龄 最 小 的 JNG， 其 他 所 有 学 生 都 会 被 返回 。) 
select distinct s1.* 
from student s1, 


student s2 
where sl.age > s2.age 





SNO SNAME AGE 
5 STEVE 22 
7 BRIAN 21 
10 CHAD 21 
2 CHUCK 21 
1 AARON 20 
3 DOUG 20 
9 GILLIAN 20 
8 KAY 20 
4 MAGGIE 19 


接 下 来 ， 找 出 比 其 他 2 个 或 更 多 学 生年 龄 大 的 学 生 (JING 和 MAGGIE 会 被 排除 掉 ) 。 


select distinct s1.* 
from student s1, 
student s2, 
student s3 
where sl.age > s2.age 
and s2.age » s3.age 


SNO SNAME AGE 
1 AARON 20 
2 CHUCK 21 
3 DOUG 20 
5 STEVE 22 
7 BRIAN 21 
8 KAY 20 
9 GILLIAN 20 
10 CHAD 21 
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最 后 ， 找 出 比 其 他 3 个 或 更 多 学 生年 龄 大 的 学 生 (只 保留 CHUCK、STEVE、BRIAN 和 
CHAD), 


select distinct s1.* 

from student s1, 
student s2, 
student s3, 
student s4 

where sl.age > s2.age 

and s2.age » s3.age 

and s3.age » s4.age 


SNO SNAME AGE 
2 CHUCK 21 
5 STEVE 22 
7 BRIAN 21 
10 CHAD 21 





现在 我 们 知道 了 哪些 学 生 比 其 他 3 个 或 更 多 学 生年 龄 大 ， 只 需要 在 子 查询 中 使 用 NOT IN 就 
可 以 筛选 出 除了 上 述 4 人 之 外 的 那些 学 生 。 


B.4 At Least 条 件 问 题 


At Most 条 件 的 反面 就 是 At Least 条 件 *。 处 理 At Least 条 件 问 题 时 ,我 们 经 常用 到 的 技巧 是 把 
它 转换 为 等 价 的 At Most 条 件 问 题 。 我 们 可 以 把 At Least 条 件 重 新 表述 为 “不 少 于 XX 个 ”。 
一 般 来 说 ， 如 果 我 们 能 够 从 需求 中 识别 出 装 值 ， 那 么 问题 就 算 解 决 一 半 了 。 确 立 了 国 值 
之 后 ， 我 们 可 以 选择 解决 问题 的 方式 ; 从 正面 人手 (使 用 聚合 国 数 或 窗口 国 数 ， 例 如 
COUNT) ， 或 者 从 侧面 入 手 (使 用 子 查询 和 逻辑 否定 )。 












































B.4.1 问题 6 
你 希望 找 出 至 少 选修 了 两 门 课程 的 学 生 。 


换 一 种 方式 表述 问题 的 话 可 能 有 用 ， 比 如 :“ 找 出 选修 了 两 门 以 上 课程 的 学 生 ”， 或 者 “ 找 
出 选修 的 课程 数量 不 少 于 两 门 的 学 生 ”。 我 们 不 妨 使 用 前 面 的 问题 4 中 用 过 的 技巧 : 使 用 
聚合 函数 COUNT 或 窗口 函数 COUNT OVER。 最 终 的 结果 集 应 该 如 下 所 示 。 









































SNO SNAME AGE 

1 AARON 20 

3 DOUG 20 

4 MAGGIE 19 

6 JING 18 
MySQL 和 PostgreSQL 





使 用 聚合 函数 COUNT fige CH RIPE TA RERE. 








注 2: 意 为 “最 多 XX 个 ”。 一 一 译 者 注 
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1 select s.sno,s.sname,s.age 

2 from student s, take t 

3 where s.sno = t.sno 

4 group by s.sno,s.sname,s.age 
5 having count(*) >= 2 


DB2. Oracle 和 SQL Server 
使 用 窗口 函数 COUNT OVER 筛选 出 至 少 选 修了 两 门 课程 的 学 生 。 


1 select distinct sno,sname,age 

2 from ( 

3 select s.sno,s.sname,s.age, 

4 count(*) over ( 

5 partition by s.sno,s.sname,s.age 
6 ) as cnt 

7 from student s, take t 

8 where s.sno = t.sno 

9 )x 

0 


where cnt >= 2 


[EY 


讨论 
问题 4 的 “讨论 ”部 分 也 适用 于 本 问题 的 解决 方案 ， 它 们 使 用 的 方法 和 技巧 相同 。 聚 合 函 
数 解决 方案 先 把 STUDENT 表 和 TAKE 表 连 接 起 来 ， 然 后 在 HAVING 子 句 中 使 用 COUNT 筛选 出 
那些 选修 了 两 门 以 上 课程 的 学 生 。 窗 口 函 数 解决 方案 则 先 连 接 STUDENT 表 和 TAKE 表 ， 然 后 
使 用 STUDENT 表 的 全 部 列 定义 分 区 并 执行 COUNT OVER 操作 。 最 后 ， 只 要 保留 那些 CNT 大 于 
或 者 等 于 2 的 行 即 可 。 
原 解决 方案 
下 面 的 解决 方案 使 用 TAKE 表 的 自 连 接 找 出 选修 了 两 门 以 上 课程 的 学 生 。 子 查询 里 的 SNo 相 
等 条 件 能 够 确保 每 个 学 生 只 与 自己 的 选课 信息 相 比 较 。 至 于 CN0 大 于 比较 条 件 ， 只 有 在 一 
个 学 生 至 少 选修 了 一 门 课程 的 情况 下 才 会 成 立 ， 否 则 CN0O 会 等 于 另 一 个 CN0。( 因 为 只 有 一 
门 课程 ， 只 能 和 自身 比较 。) 最 后 ， 返 回 子 查询 筛选 出 的 那些 学 生 ， 如 下 所 示 。 
select * 
from student 
where sno in ( 
select tl.sno 
from take t1, 
take t2 


where tl.sno = t2.sno 
and t1.cno > t2.cno 












































) 

SNO SNAME AGE 
1 AARON 20 
3 DOUG 20 
4 MAGGIE 19 
6 JING 18 
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B.4.2 问题 7 


你 希望 找 出 同时 选修 了 csii2 和 CS114 两 门 课程 的 学 生 。 这 些 学 生 可 能 也 选修 了 其 他 课程 ， 
但 他 们 必须 同时 选修 CS112 和 CS114, 

本 问题 类 似 于 问题 2， 问 题 2 要 求学 生 只 能 选修 其 中 一 门 课程 ， 而 本 问题 则 要 求学 生 两 门 
课程 都 要 选 。( 只 有 AARON fl DOUG 同时 选修 了 cs112 和 CS114,) 我 们 只 要 修改 问题 2 
的 解决 方案 ， 就 能 轻松 解决 本 问题 。 最 终 的 结果 集 应 该 如 下 所 示 。 






































SNO SNAME AGE 
1 AARON 20 
3 DOUG 20 
MySQL 和 PostgreSQL 
使 用 聚合 函数 MIN 和 MAX 找 出 同时 选修 了 CS112 和 CS114 课程 的 学 生 。 
1 select s.sno, s.sname, s.age 
2 from student s, take t 
3 where s.sno = t.sno 
4 and t.cno in ('CS114','CS112') 
5 group by s.sno, s.sname, s.age 
6 having min(t.cno) != max(t.cno) 


DB2. Oracle 和 SQL Server 
使 用 窗口 函数 MIN OVER 和 MAX OVER 找 出 同时 选修 了 CS112 和 CS114 课程 的 学 生 。 


1 select distinct sno, sname, age 

2 from ( 

3 select s.sno, s.sname, s.age, 

4 min(cno) over (partition by s.sno) as min_cno, 
5 max(cno) over (partition by s.sno) as max_cno 
6 from student s, take t 

7 where s.sno = t.sno 

8 and t.cno in ('CS114','CS112') 

9 ) x 

0 


where min_cno != max_cno 


= 


讨论 
以 上 两 种 解决 方案 的 做 法 相同 。IN 列表 确保 只 有 选修 CS112 或 CS114， 或 者 同时 两 门 都 选 
了 的 学 生 才 会 被 保留 下 来 。 如 果 一 个 学 生 没 有 同时 选修 这 两 门 课程 ， 那 么 MIN(CN0) 就 会 等 
于 MAX(CN0)， 进 而 该 学 生 会 被 排除 在 外 。 为 了 直观 地 解释 这 一 处 理 过 程 ， 我 们 不 妨 打 印 出 
窗口 函数 解决 方案 的 中 间 结 果 。( 为 便于 理解 ， 这 里 增加 了 .CN0,) 
select s.sno, s.sname, s.age, t.cno, 
min(cno) over (partition by s.sno) as min_cno, 
max(cno) over (partition by s.sno) as max_cno 
from student s, take t 


where s.sno = t.sno 
and t.cno in ('CS114','CS112') 









































SNO SNAME AGE CNO MIN_C MAX C 
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1 AARON 20 CS114 CS112 CS114 
1 AARON 20 CS112 CS112 CS114 
2 CHUCK 21 CS112 CS112 CS112 
3 DOUG 20 CS114 CS112 CS114 
3 DOUG 20 CS112 CS112 CS114 
4 MAGGIE 19 CS112 CS112 CS112 
6 JING 18 CS114 CS114 CS114 




















仔细 观察 上 述 结果 集 ， 我 们 会 发 现 只 有 AARON 和 DOUG 满足 条 件 MIN(CNO) != MAX(CNO) 。 





原 解 决 方案 
The Essence of SQL 一 书 中 的 解决 方案 用 到 了 TAKE 表 的 自 连 接 ， 该 解决 方案 如 下 所 示 。 
select s.* 
from student s, 
take t1, 
take t2 
where s.sno = tl.sno 
and t1.sno = t2.sno 
and t1.cno = 'CS112' 
and t2.cno = 'CS114' 
SNO SNAME AGE 
1 AARON 20 
3 DOUG 20 

















以 上 所 有 解决 方案 都 能 确保 不 论 最 终结 果 集 里 的 学 生 有 没有 选修 其 他 课程 ， 他 们 都 同时 
选修 了 CS112 和 C5114。 如 果 你 对 上 述 自 连接 操作 还 不 太 理 解 ， 请 试 试 看 能 否 读 慌 下 面 的 
代码 。 






































select s.* 
from take t1, student s 
where s.sno = tl.sno 
and ti.cno = 'CS114' 
and 'CS112' = any (select t2.cno 
from take t2 
where t1.sno = t2.sno 
and t2.cno != 'CS114') 
SNO SNAME AGE 
1 AARON 20 
3 DOUG 20 


B.4.3 问题 8 
找 出 那些 至 少 比 其 他 两 位 学 生年 龄 大 的 学 生 。 


把 本 问题 重新 表述 一 下 可 能 更 易于 理解 ,“ 找 出 年 龄 大 于 两 个 以 上 同学 的 学 生 ”。 我 们 可 以 
再 次 使 用 问题 5 的 做 法 和 技巧 。 最 终 的 结果 集 如 下 所 示 。( 只 有 JING fll MAGGIE 不 符合 


条 件 。) 
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1 AARON 20 
2 CHUCK 21 
3 DOUG 20 
5 STEVE 22 
7 BRIAN 21 
8 KAY 20 
9 GILLIAN 20 
10 CHAD 21 
iy 和 PostgreSQL 








使 用 聚合 函数 COUNT 和 关联 子 查 询 找 出 至 少 比 其 他 两 位 学 生年 龄 大 的 学 生 。 


1 select s1.* 

2 from student s1 

3 where 2 <= ( select count(*) 

4 from student s2 

5 where s2.age <sl.age ) 


DB2. Oracle 和 SQL Server 
使 用 窗口 函数 DENSE_RANK 找 出 至 少 比 其 他 两 位 学 生年 龄 大 的 学 生 


select sno,sname,age 
from ( 
select sno,sname,age, 
dense rank()over(order by age) as dr 
from student 
)x 


where dr >= 3 














ONA n L OO N 请 


讨论 
请 参见 问题 5 的 iow 部 分 。 上 述 两 种 解决 方案 的 类 似 ， 唯 一 的 差别 在 于 最 后 是 通过 计 
数值 还 是 排名 来 筛选 出 结果 。 
原 解决 方案 
本 问题 由 问题 6 衍生 而 来 ， 不 同 之 处 在 于 这 里 只 需要 和 STUDENT 表 打 交道 。 适 当 修改 问题 
6 的 解决 方案 就 可 以 解决 本 问题 ， 如 下 所 示 。 
select distinct s1.* 
from student s1, 
student s2, 
student s3 


where sl.age > s2.age 
and s2.age » s3.age 











SNO SNAME AGE 
1 AARON 20 
2 CHUCK 21 
3 DOUG 20 
5 STEVE 22 
7 BRIAN 21 
8 KAY 20 
9 GILLIAN 20 
10 CHAD 21 
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B.5 “Exactly 问 题 


你 可 能 会 认为 , “确认 某 些 条 件 是 否 成 立 ” 并 不 难 。 许 多 时 候 也 确实 如 此 。 不 过 ， 一 旦 牵 
扯 到 “精确 的 数量 条 件 ”(Exactly) 时 ， 这 类 问题 也 可 能 会 瞬间 变 得 环 手 起 来 ， 尤 其 是 当 
我 们 必须 把 多 个 表 连 接 起 来 寻求 答案 时 。 问 题 的 根源 在 于 精确 的 数量 条 件 具 有 排他 性 。 有 
时 候 我 们 可 以 把 “Exactly” 理 解 成 “Only”。 不 妨 体 会 一 下 这 两 种 表述 的 不 同 之 处 :“ 穿 着 
鞋子 的 人 ”和 “只 穿着 鞋子 的 人 ”。 仅 仅 满 足 指定 的 条 件 (穿着 鞋子 ) 是 不 够 的 ， 我 们 还 
必须 确保 在 满足 该 条 件 的 同时 ， 其 他 条 件 不 会 成 立 〈 确 保 设 有 穿 鞋子 之 外 的 其 他 衣物 ) 。 


21 



































B.5.1 问题 9 
找 出 只 讲授 一 门 课程 的 教授 。 


教授 们 讲授 哪些 课程 并 不 重要 ， 我 们 关注 的 是 他 们 是 否 只 讲授 一 门 课程 。 最 终 的 结果 集 应 
该 如 下 所 示 。 





LNAME DEPT SALARY AGE 
POMEL SCIENCE 500 65 
MySQL 和 PostgreSQL 


使 用 聚合 函数 COUNT 找 出 只 讲授 一 门 课程 的 教授 。 





1 select p.lname,p.dept,p.salary,p.age 

2 from professor p, teach t 

3 where p.lname = t.lname 

4 group by p.Lname,p.dept,p.saLary,p.age 
5 having count(*) = 1 


DB2, Oracle 和 SQL Server 
使 用 窗口 函数 COUNT OVER 找 出 只 讲授 一 门 课程 的 教授 。 








1 select lname, dept, salary, age 

2 from ( 

3 select p.lname,p.dept,p.salary,p.age, 

4 count(*) over (partition by p.lname) as cnt 

5 from professor p, teach t 

6 where p.lname = t.lname 

7 )x 

8 where cnt = 1 

讨论 

通过 内 连接 PROFESSOR 表 和 TEACH 表 ， 我 们 能 够 确保 把 不 讲授 任何 课程 的 教授 都 排除 掉 。 聚 
合 函数 解决 方案 在 HAVING 子 句 里 使 用 COUNT 函数 返回 只 讲授 一 门 课程 的 教授 。 窗 口 函 数 解 
决 方案 使 用 COUNT OVER 函数 ， 但 请 留意 COUNT OVER 国 数 的 PARTITION 子 名 用 到 的 PROFESSOR 
表 的 列 ， 它 们 不 同 于 聚合 函数 解决 方案 GROUP BY 子 句 中 的 那些 列 。 对 于 本 例 而 言 ，GROUP BY 
和 PARTITION BY 后 面 的 列 可 以 不 相同 ， 因 为 PROFESSOR 表 的 LNAME 列 具 有 唯一 性 。 也 就 是 
说 ， 即 使 没有 P.DEPT、P.SALARY #H P.AGE, COUNT 操作 的 结果 也 不 会 出 错 。 在 前 儿 个 实例 中 ， 
我 有 意 地 在 窗口 函数 解决 方案 的 PARTITION 子 句 和 聚合 函数 解决 方案 的 GROUP BY 子 句 中 放置 
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相同 的 列 ， 
原 解 决 方案 


The Essence of SOL 一 书 中 的 解决 方案 用 到 了 和 问题 3 同样 的 技巧 : 


这 样 做 是 为 了 告诉 你 PARTITION 是 动态 的 、 更 灵活 的 GROUP BY。 





步 是 找到 讲授 了 两 | ] 以 上 课程 的 教授 。 第 二 步 是 找到 讲授 了 至 少 一 门 课程 但 不 存在 于 第 








步 返 回 





结 采集 


select p. 
professor p, 


from 


的 教授 。 完 整 的 讨 t 


* 


teach t 


where p. 

and p. 
ti.lname 
teach t1, 


select 
from 


lname = t.lname 
lname not in ( 


teach t2 


where 
and 


) 


LNAME 


ti.lname = t2.lname 
t1.cno 


» t2.cno 


SALARY 


华人 参见 问题 3， 解 决 方案 如 下 所 示 。 


POMEL 


B.5.2 
你 希 








SCIENCE 


问题 10 


只 选修 cs112 和 C5114 课程 的 学 生 ( 








的 查询 返 





select s. 
student s, 
where s. 
and t. 
and t. 


一 行 记 录 而 言 ， 一 列 不 可 能 包含 两 个 值 


from 


对 于 任何 





STUDENT 表 的 值 )， 
中 对 于 犯 了 类 似 错误 的 SQL 语句 已 经 做 过 详尽 讨论 。 这 里 


因此 最 终 的 查 











sno = 
cno = 
cno = 





只 选 了 这 两 门 ， 没 有 选 其 他 课程 








分 两 步 找到 答案 。 [T 





, ETÉ 


























因此 上 述 查 询 不 会 


询 结 果 应 该 只 包含 DOUG。 





MySQL 和 PostgreSQL 
使 用 CASE 表达 式 和 聚合 函 


1 select 
2 from 
3 where 
4 group 
5 having 
6 and 
7 








数 COUNT 找 出 只 选 


s.sno, s.sname, s.age 
student s, take t 

s.sno = t.sno 

by s.sno, s.sname, s.age 
count(*) = 2 
max(case when cno 
max(case when cno 


DB2. Oracle 和 SQL Server 


使 用 窗口 函数 COUNT OVER 和 CASE 表达 式 找 出 只 选修 CS112 和 CS114 课程 的 学 生 。 





修 cs112 和 cs114 课程 的 学 生 。 





'CS112' then 1 else 0 end) + 
'CS114' then 1 else 0 end) = 2 





(此 处 指 的 是 简单 数据 类 型 ， 就 像 
篇 选 出 任何 有 意义 的 结果 。The Essence of SOL 一 书 
DOUG 是 唯一 符合 条 件 的 学 生 ， 
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1 select sno,sname,age 

2 from ( 

3 select s.sno, 

4 s.sname, 

5 s.age, 

6 count(*) over (partition by s.sno) as cnt, 
7 sum(case when t.cno in ( 'CS112', 'CS114' ) 
8 then 1 else 0 

9 end) 

10 over (partition by s.sno) as both, 

11 row number() 

12 over (partition by s.sno order by s.sno) as rn 


13 from student s, take t 
14 where s.sno - t.sno 


15 )x 

16 where cnt = 2 

17 and both - 2 

18 and rn 21 
讨论 


聚合 函数 解决 方案 的 做 法 和 问题 1 以 及 问题 2 的 相同 。STUDENT 表 和 TAKE 表 的 内 连接 能 够 
确保 没有 选修 任何 课程 的 学 生 被 排除 掉 。HAVING 子 名 的 COUNT 表达 式 只 保留 选修 两 门 课程 
的 学 生 。CASE 表达 式 先 计数 课程 数目 ， 然 后 再 求 和 。 只 有 选修 了 csii2 和 CS114 两 门 课程 
的 学 生 ， 其 SuM 结果 才 可 能 等 于 2. 


窗口 函数 解决 方案 使 用 到 的 技巧 也 类 似 于 问题 1 和 问题 2。 这 里 稍微 不 同 的 一 点 是 ，CASE 
表达 式 的 结果 计算 出 来 之 后 会 被 传递 给 窗口 函数 SUM ovER。 本 解决 方案 另 一 个 值得 注意 
处 是 ， 我 们 使 用 了 窗口 函数 ROW_NUMBER， 从 而 避免 使 用 DISTINCT。 不 妨 先 去 掉 窗口 函数 解 
决 方案 最 后 的 过 滤 条 件 ， 看 一 下 中 间 结 果 ， 如 下 所 示 。 


select s.sno, 
s.sname, 
s.age, 
count(*) over (partition by s.sno) as cnt, 
sum(case when t.cno in ( 'CS112', 'CS114' ) 
then 1 else 0 
end) 
over (partition by s.sno) as both, 
row number( ) 
over (partition by s.sno order by s.sno) as rn 
from student s, take t 
where s.sno - t.sno 





1 


























SNO SNAME AGE CNT BOTH RN 


1 AARON 20 3 2 1 
1 AARON 20 3 2 2 
1 AARON 20 3 2 3 
2 CHUCK 21 1 1 1 
3 DOUG 20 2 2 1 
3 DOUG 20 2 2 2 
4 MAGGIE 19 2 1 1 
4 MAGGIE 19 2 1 2 
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5 STEVE 
6 JING 
6 JING 


仔细 观察 上 述 结 果 ， 我 们 看 到 最 终 的 结果 集 是 BOTH 和 CNT 都 等 于 2 的 那 一 行 。 其 实 RN 值 


22 
18 
18 





1 
2 
2 


1 
1 


1 
1 
2 





























等 于 1 或 2 都 没有 关系 ， 该 列 的 作用 在 于 去 掉 重 复 项 ， 因 此 我 们 无 须 使 用 DISTINCT。 


原 解决 方案 








The Essence of SQL 一 书 中 的 解决 方案 使 用 含有 多 个 自 连 接 的 子 查询 首先 找到 至 少 选 修了 
3 门 课程 的 学 生 。 然 后 ， 使 用 TAKE 表 的 自 连 接 找 出 选修 CS112 和 CS114 的 学 生 。 最 后 得 
选 出 选修 cs112 和 CS114， 但 选修 课程 数量 又 不 多 于 两 门 的 学 生 。 解 决 方案 如 下 所 示 。 


select s1.* 
from student s1, 
take t1, 
take t2 
where si.sno = tí.sno 
and si.sno = t2.sno 
and ti.cno = 'CS112 
and t2.cno - 'CS114 
and s1.sno not in ( 
select s2.sno 
from student s2, 
take t3, 
take t4, 
take t5 
where s2.sno = t3.sno 
and s2.sno - t4.sno 
and s2.sno - t5.sno 
and t3.cno » t4.cno 
and t4.cno » t5.cno 
) 
SNO SNAME AGE 
3 DOUG 20 
* 
B.5.3 问题 11 











你 希望 找 出 比 其 他 两 位 学 生年 龄 大 的 学 生 。 本 问题 的 另 一 种 陈述 方式 是 : 找 出 按照 年 龄 从 
小 到 大 排序 排 在 第 三 位 的 学 生 。 





SNO SNAME AGE 

1 AARON 20 

3 DOUG 20 

8 KAY 20 

9 GILLIAN 20 
MySQL 和 PostgreSQL 


最 终 的 结果 集 应 该 如 下 所 示 。 








使 用 聚合 函数 COUNT 和 关联 子 查询 找 出 按照 年 龄 从 小 到 大 排序 排 在 第 三 位 的 学 生 。 
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1 select s1.* 

2 from student s1 

3 where 2 = ( select count(*) 

4 from student s2 

5 where s2.age <sl.age ) 


DB2, Oracle fe SQL Server 
使 用 窗口 函数 DENSE, RANK 找 出 按照 年 龄 从 小 到 大 排序 排 在 第 三 位 的 学 生 。 








1 select sno,sname,age 

2 from ( 

3 select sno,sname,age, 

4 dense rank()over(order by age) as dr 
5 from student 

6 )x 

7 


where dr = 3 
讨论 
聚合 函数 解决 方案 使 用 标量 子 查 询 找 出 年 龄 大 于 其 他 两 位 ( 且 只 有 两 位 ) 同学 的 学 生 。 为 
了 更 清楚 地 展示 处 理 过 程 ， 下 面 我 们 改写 上 述 解 决 方案 的 代码 。 在 下 面 的 例子 中 ，CNT 列 
代表 比 当 前 学 生年 龄 小 的 学 生 人 数 。 
select s1.*, 
(select count(*) from student s2 


where s2.age < sl.age) as cnt 
from student s1 












































order by 4 

SNO SNAME AGE CNT 
6 JING 18 0 
4 MAGGIE 19 A 
1 AARON 20 2 
3 DOUG 20 2 
8 KAY 20 2 
9 GILLIAN 20 2 
2 CHUCK 21 6 
7 BRIAN 21 6 
10 CHAD 21 6 
5 STEVE 22 9 


改写 后 的 查询 便于 我 们 看 清楚 谁 是 按照 年 龄 从 小 到 大 排序 排 在 第 三 位 的 学 生 (也 就 是 CNT 
值 等 于 2 的 学 生 )。 


使 用 了 窗口 函数 DENSE_RANK 的 解决 方案 类 似 于 上 述 标量 子 查询 的 做 法 ， 根 据 有 多 少 位 学 生 

比 当前 学 生年 龄 小 为 每 一 个 学 生 排名 。(DENSE_RANK 不 仅 允 许 Tie 的 存在 ， 也 能 保证 名 次 连 

续 ， 中 间 不 留 空白 。) 下 面 的 查询 展示 了 DENSE RANK 函数 的 输出 结果 。 
select sno,sname,age, 


dense_rank()over(order by age) as dr 
from student 
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6 JING 18 1 

4 MAGGIE 19 2 

1 AARON 20 3 

3 DOUG 20 3 

8 KAY 20 3 

9 GILLIAN 20 3 

2 CHUCK 21 4 

7 BRIAN 21 4 

10 CHAD 21 4 

5 STEVE 22 5 
RUE BRAWA ABALERI P, RER DR 值 等 于 3 的 行 。 
原 解决 方案 
The Essence of SQL 一 书 中 的 解决 方案 分 为 两 步 : 首先 找 出 比 3 名 以 上 学 生年 龄 大 的 学 生 。 








然后 找 出 比 两 位 以 上 学 生年 龄 大 的 学 生 ， 但 又 不 属于 第 一 步 返 回 结果 集 的 学 生 。David 
Rozenshtein 这 样 表述 其 思路 :“ 找 出 至 少 比 两 名 学 生年 龄 大 ， 但 又 不 比 3 名 以 上 学 生年 龄 
大 的 学 生 。” 解 决 方案 如 下 所 示 。 


select s5.* 
from student s5, 
student s6, 
student s7 
where s5.age > s6.age 
and s6.age > s7.age 
and s5.sno not in ( 
select sl.sno 
from student s1, 
student s2, 
student s3, 
student s4 
where sl.age > s2.age 
and s2.age » s3.age 
and s3.age » s4.age 














) 

SNO SNAME AGE 
1 AARON 20 
3 DOUG 20 
9 GILLIAN 20 
8 KAY 20 


上 述 解决 方案 做 法 与 问题 5 相同 。 你 不 妨 参考 问题 5 的 “讨论 ”部 分 ， 体 会 一 下 如 何 充 分 
利用 自 连接 查询 解决 问题 。 


B.6 Any 和 All 问 题 


涉及 “Any”( 任 意 一 个 ) E “AN” (全 部 ) 的 查询 通常 要 求 我 们 找 出 完全 符合 一 个 条 件 
或 多 个 条 件 的 行 。 例 如 ， 如 果 要 找 出 “ 吃 所 有 蔬菜 的 人 ”， 实 际 上 要 寻找 的 人 是 “没有 任 
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何 一 种 蔬菜 他 们 不 吃 ”。 这 种 问题 通常 被 归 类 为 “关系 除法 ”(relational division) 。 对 于 
“Any” 问 题 ， 很 重要 的 一 点 是 ， 我 们 要 特别 注意 问题 的 陈述 方式 。 考 虑 如 下 两 种 不 同 的 问 
题 陈述 :“ 选 修了 任意 一 门 课程 的 学 生 ” 和 “ 比 任何 火车 都 快 的 飞机 ”。 前 者 要 求 的 是 “ 找 
出 选修 了 至 少 一 门 课程 的 学 生 ”， 而 后 者 的 要 求 是 “ 找 出 比 所 有 火车 都 快 的 飞机 ”。 











B.6.1 问题 12 
你 希望 找 出 选修 了 全 部 课程 的 学 生 。 
在 TAKE 表 中 一 个 学 生 选 修 的 课程 总 数 必须 等 于 COURSES 表 中 所 有 课程 的 总 数 。COURSES 表 


里 有 3 门 课程 。 po AARON 选修 了 全 部 3 门 课程 ， 因 此 AARON 应 该 是 唯一 被 返回 的 学 
生 。 最 终 的 结果 集 应 该 如 下 所 示 。 


SNO SNAME AGE 





























MySQL 和 PostgreSQL 
使 用 聚合 国 数 COUNT 找 出 选修 所 有 课程 的 学 生 。 


1 select s.sno,s.sname,s.age 

2 from student s, take t 

3 where s.sno = t.sno 

4 group by s.sno,s.sname,s.age 

5 having count(t.cno) = (select count(*) from courses) 


DB2 和 SQL Server 
使 用 窗口 函数 COUNT OVER， 并 使 用 外 连接 而 不 是 子 查 询 。 





1 select sno,sname,age 
2 from ( 
3 select s.sno,s.sname,s.age, 
4 count(t.cno) 
5 over (partition by s.sno) as cnt, 
6 count(distinct c.title) over() as total, 
7 row number() over 
8 (partition by s.sno order by c.cno) as rn 
9 from courses c 
10 left join take t on (c.cno = t.cno) 
11 left join student s on (t.sno = s.sno) 
12 )x 
13 where cnt - total 
14 and rn = 1 
Oracle 


上 述 DB2 解决 方案 也 适用 于 Oracle 9; 及 后 续 版 本 。 除 此 之 外 ， 也 可 以 使 用 Oracle 专 有 的 
外 连接 句 语 法。 对 于 Oracle 8i 及 更 早 版 本 而 言 则 只 能 使 用 该 解决 方案 。 


1 select sno,sname,age 

2 from ( 

3 select s.sno,s.sname,s.age, 
4 count(t.cno) 
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5 over (partition by s.sno) as cnt, 

6 count(distinct c.title) over() as total, 
7 row_number() over 

8 (partition by s.sno order by c.cno) as rn 
9 from courses c, take t, student s 

10 where c.cno = t.cno (+) 

11 and t.sno = s.sno (+) 

12 ) 

13 where cnt = total 

14 and rn = 1 


讨论 

聚合 国 数 解决 方案 使 用 子 查询 返回 课程 总 数 ， 外 层 查询 负责 盘 选 出 选修 课程 数量 等 于 子 
查询 返回 值 的 学 生 。 窗 口 函 数 解决 方案 采取 了 男 一 种 做 法 : 它 外 连接 到 COURSES 表 ， 而 不 
是 子 查询 。 窗 口 函 数 解 决 方案 使 用 窗口 函数 返回 一 个 学 生 选 修 的 课程 数量 (别名 CNT) 和 
COURSES 表 里 的 课程 总 数 (别名 TOTAL)。 下 面 的 查询 展示 了 这 些 窗 口 函数 的 中 间 结 果 。 


select s.sno,s.sname,s.age, 
count(distinct t.cno) 
over (partition by s.sno) as cnt, 
count(distinct c.title) over() as total, 
row_number( ) 
over(partition by s.sno order by c.cno) as rn 
from courses c 


















































left join take t on (c.cno = t.cno) 
left join student s on (t.sno = s.sno) 
order by 1 
SNO SNAME AGE CNT TOTAL RN 
1 AARON 20 3 3 1 
1 AARON 20 3 3 2 
1 AARON 20 3 3 3 
2 CHUCK 21 1 3 1 
3 DOUG 20 2 3 1 
3 DOUG 20 2 3 2 
4 MAGGIE 19 2 3 1 
4 MAGGIE 19 2 3 2 
5 STEVE 22 1 3 1 
6 JING 18 2 3 1 
6 JING 18 2 3 2 





CNT 和 TOTAL 值 相 等 的 行 就 是 选修 全 部 课程 的 学 生 。 这 里 没有 使 用 DISTINCT， 而 是 使 用 
ROW. NUMBER 剔除 掉 重 复 项 。 严 格 地 说 ，TAKE 表 和 STUDENT 表 的 外 连接 并 不 是 必须 的 ， 因 为 
每 一 门 课程 都 被 选修 过 。 如 果 有 一 门 课程 大 家 都 没有 选 ， 则 CNT 和 TOTAL 不 可 能 相等 ，# 
且 对 应 行 的 SNO, SNAME 和 AGE 都 是 Null。 在 下 面 的 例子 中 ， 我 们 添加 了 一 门 新 课程 ， 这 门 
课程 当然 不 曾 有 学 生 选 过 。 通 过 下 面 的 查询 我 们 可 以 看 到 ， 如 果 存 在 一 门 所 有 学 生 都 没有 
选 的 课程 会 出 现 什么 样 的 中 间 结 果 。( 为 了 便于 理解 ， 查 询 结果 增加 了 C.TITLE Zl.) 


insert into courses values ('CS115','BIOLOGY',4) 






























































select s.sno,s.sname,s.age,c.title, 
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count(distinct t.cno) 

over (partition by s.sno) as cnt, 

count(distinct c.title) over() as total, 

row number( ) 

over(partition by s.sno order by c.cno) as rn 
from courses c 

left join take t on (c.cno - t.cno) 

left join student s on (t.sno - s.sno) 


order by 1 
SNO SNAME AGE TITLE CNT TOTAL RN 
1 AARON 20 PHYSICS 3 4 1 
1 AARON 20 CALCULUS 3 4 2 
1 AARON 20 HISTORY 3 4 3 
2 CHUCK 21 PHYSICS 1 4 1 
3 DOUG 20 PHYSICS 2 4 1 
3 DOUG 20 HISTORY 2 4 2 
4 MAGGIE 19 PHYSICS 2 4 1 
4 MAGGIE 19 CALCULUS 2 4 2 
5 STEVE 22 CALCULUS 1 4 1 
6 JING 18 CALCULUS 2 4 1 
6 JING 18 HISTORY 2 4 2 
BIOLOGY 0 4 1 


仔细 观察 上 述 结果 ， 很 容易 就 能 看 出 任何 一 行 都 无 法 满足 最 后 的 那个 过 滤 条 件 。 另 外 还 
要 注意 的 一 点 是 ， 窗 口 函 数 会 在 WHERE 子 句 之 后 执行 ， 因 此 计算 COURSES 表 的 课程 总 数 
时 ， 需 要 使 用 DISTINCT。( 否 则 ， 计 算出 来 的 结果 就 是 所 有 学 生 选 课 的 总 人 次 ， 即 select 


count(cno) from take, ) 








ER TAKE 表 中 不 存在 重复 项 ， 因 此 该 解决 方案 能 正常 执行 。 如 果 TAKE RAE 
š 复 项 ， — s LH M 那么 该 解决 方案 就 不 对 了 。 简 
"" 单 改动 上 述 解 决 方案 就 可 以 解决 重复 项 问题 : COUNT(T.CNO) 时 加 上 DISTINCT, 


























原 解 决 方案 
The Essence of SOL 一 书 中 的 解决 方案 没有 使 用 聚合 函数 ， 却 用 了 笛 卡 儿 积 ， 其 做 法 非常 巧 
妙 。 下 面 的 查询 就 是 该 解决 方案 。 
select * 
from student 
where sno not in 
( select s.sno 


from student s, courses c 
where (s.sno,c.cno) not in (select sno,cno from take) ) 


David Rozenshtein 重新 表述 了 该 问题 :“ 针 对 每 一 个 学 生 ， 找 出 他 们 没有 选 过 的 课程 ， 最 后 
如 果 有 谁 不 在 其 中 ， 则 他 必定 选修 了 全 部 课程 。 ”以 这 种 方式 看 待 本 问题 的 话 ， 就 回 到 了 
前 面 讨论 过 的 逻辑 否定 问题 。 重 新 回顾 一 下 David Rozenshtein 关于 处 理 逻 辑 否 定 问题 的 建 

“解决 逻辑 否定 问题 有 两 个 步 又， 首先 要 想 找 出 “ 谁 没 有 做 某 事 ” ， 就 先 找到 “ 谁 做 了 
某 事 "， 然 后 排除 掉 这 些 人 。” 
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最 内 层 的 子 查 询 会 返回 所 有 有 效 的 SNO/CNO 组 合 。 中 间 一 层 的 子 查询 使 用 STUDENT 表 和 
COURSES 表 之 间 的 笛 卡 儿 积 ， 返 回 (假设 每 一 个 学 生 都 选修 了 全 部 课程 ) 所 有 可 能 的 SNO/ 
CN0 组 合 ， 进 而 过 滤 掉 有 效 的 SNO/CNO 组 合 (只 留 下 了 实际 上 不 存在 的 SNO/CNO 组 合 )。 对 
于 最 外 层 的 查询 ， 只 有 当 SN0 不 存在 于 中 间 一 层 子 查询 结果 时 ， 才 会 被 保留 下 来 。 看 一 下 
如 下 所 示 的 几 个 查询 ， 你 可 能 就 会 更 清楚 本 解决 方案 的 思路 。 为 提高 可 读 性 ， 这 里 只 用 到 
T AARON 和 CHUCK (只 有 AARON 选修 了 所 有 课程 ) 。 











select * 
from student 
where sno in ( 1,2 ) 


SNO SNAME AGE 
1 AARON 20 
2 CHUCK 21 
select * 
from take 


where sno in ( 1,2 ) 


SNO CNO 
1 CS112 
1 CS113 
1 CS114 
2 CS112 


select s.sno, c.cno 

from student s, courses c 
where s.sno in ( 1,2 ) 
order by 1 




















上 述 查 询 分 别 打印 出 了 STUDENT rH 5 AARON 和 CHUCK 相关 的 行 ，AARON 和 CHUCK 
选修 过 的 课程 ， 以 及 假设 AARON 和 CHUCK 选修 了 全 部 课程 情况 下 的 第 卡 儿 积 。 第 卡 儿 
积 中 与 AARON 相关 的 行 和 TAKE 表 中 的 数据 相同 ， 但 笛 卡 儿 积 中 与 CHUCK 相关 的 数据 ， 





其 中 有 两 行 实际 上 不 存在 于 TAKER. TÉ 








i 给 出 了 中 间 一 层 的 子 查 询 ， 它 使 用 NOT IN 排除 





掉 有 效 的 SNO/CNO 组 合 。 


select s.sno, c.cno 
from student s, courses c 
where s.sno in ( 1,2 ) 


and (s.sno,c.cno) not in (select sno,cno from take) 
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SNO CNO 
2 CS113 
2 CS114 


注意 ，AARON 没有 出 现在 中 间 一 层 子 查询 的 返回 值 里 〈 因 为 AARON 选修 了 全 部 课程 )。 
中 间 一 层 子 查 询 的 结果 集 代表 币 卡 儿 积 中 CHUCK 没有 选 的 那些 课程 。 最 后 执行 最 外 层 的 
查询 ， 如 果 SNO 不 存在 于 中 间 一 层 子 查询 结果 集 ， 则 STUDENT 表 中 相应 的 行 会 被 保留 下 来 。 


select * 
from student 
where sno in ( 1,2 ) 
and sno not in 
( select s.sno from student s, courses c 
where s.sno in ( 1,2 ) 
and (s.sno,c.cno) not in (select sno,cno from take)) 


















































SNO SNAME AGE 


B.6.2 ”问题 13 
找 出 比 任何 其 他 学 生年 龄 都 大 的 学 生 。 
我 们 可 以 把 本 问题 重新 表述 为 :“ 找 出 年 龄 最 大 的 学 生 。 最 终 的 结果 集 应 该 如 下 所 示 。 














SNO SNAME AGE 
(SSENE 0 22 

MySQL 和 PostgreSQL 

在 子 查询 中 使 用 聚合 函数 MAX 找 出 年 龄 最 大 的 学 生 。 
1 select * 


2 from student 
3 where age = (select max(age) from student) 


DB2, Oracle 和 SQL Server 
fE Es] rp f Hi HI Ze MAX OVER 找 出 年 龄 最 大 的 学 生 。 


1 select sno,sname,age 

2 from ( 

3 select s.*, 

4 max(s.age)over() as oldest 
5 

6 

7 























from student s 
where n = oldest 
讨论 
以 上 两 种 解决 方案 都 使 用 了 MAX 函数 找 出 年 龄 最 大 的 学 生 。 子 查询 解决 方案 首先 计算 出 
STUDENT 表 中 最 大 的 年 龄 ， 然 后 把 计算 结果 传递 给 外 层 查询 ， 而 外 层 查 询 据 此 找 出 年 龄 等 
于 该 计算 值 的 学 生 。 窗 口 国 数 解决 方案 的 做 法 和 子 查询 解决 方案 一 样 ， 但 它 为 每 一 行 都 返 
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回 了 最 大 的 年 龄 值 。 窗 口 函 数 解决 方案 的 中 间 结 果 如 下 所 示 。 


select s.*, 
max(s.age) over() as oldest 
from student s 





SNO SNAME AGE OLDEST 
1 AARON 20 22 
2 CHUCK 21 22 
3 DOUG 20 22 
4 MAGGIE 19 22 
5 STEVE 22 22 
6 JING 18 22 
7 BRIAN 21 22 
8 KAY 20 22 
9 GILLIAN 20 22 

10 CHAD 21 22 





要 找到 年 龄 最 大 的 学 生 ， 只 要 保留 AGE=0LDEST 的 行 即 可 。 
原 解决 方案 





The Essence of SOL 一 书 中 的 解决 方案 在 子 查 询 中 使 用 STUDENT 表 自 连接 ， 以 找 出 所 有 年 龄 
小 于 其 他 学 生 的 学 生 。 外 层 查 询 则 负责 筛选 出 STUDENT 表 中 不 存在 于 上 述 子 查 询 返 回 结果 












































集中 的 学 生 。 这 一 处 理 过 程 可 以 理解 为 “ 先 找 出 至 少 比 其 他 一 位 学 生年 龄 小 的 学 生 ， 其 他 





不 存在 于 该 查询 结果 集 内 的 学 生 就 是 答案 "。 


select * 
from student 
where age not in (select a.age 
from student a, student b 
where a.age < b.age) 








上 述 子 查询 使 用 笛 卡 儿 积 找 出 A 表 中 年 龄 小 于 B 表 的 学 生 的 年 龄 值 。 唯 一 不 会 比 其 他 年 龄 
值 小 的 就 是 最 大 年 龄 值 。 上 述 子 查询 不 会 返回 该 最 大 值 。 外 层 查询 使 用 NOTIN， 从 STUDENT 
表 中 筛选 出 所 有 AGE 不 存在 于 上 述 子 查 询 返 回 结果 集 的 行 。( 在 子 查询 中 ， 如 果 A.AGE 被 返 



































回 ， 这 就 意味 着 STUDENT 表 中 存在 一 个 更 大 的 AGE 值 。) 如 果 你 不 到 








LE 解 这 个 处 

















时 过程， 不 妨 








仔细 看 一 下 如 下 所 示 的 查询 语句 。 从 概念 上 来 讲 ， 它 们 的 原理 相似 ， 但 下 面 的 查询 可 能 


具 一 般 性 。 


select * 
from student 
where age >= all (select age from student) 
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作者 简介 

Anthony Molinaro X Wireless Generation 公司 的 数据 库 开 发 人 员 ， 在 帮助 开发 人 员 改 善 SQL 查询 
效率 方面 拥有 多 年 的 丰富 经 验 。Anthony 专 精 SQL 技术 ， 他 的 客户 都 知道 遇 到 棘手 的 SQL 问题 时 
找 他 帮忙 就 对 了 。 他 博览 群 书 ， 对 关系 理论 有 深入 研究 ， 并 拥有 长 达 九 年 的 一 线 SQL 开发 经 验 。 
Anthony 十 分 熟悉 那些 新 近 加 入 标准 的 SQL 新 特性 ,例如 窗口 函数 。 


=. 

封面 介绍 

生 们 的 图 书 封面 之 所 以 与 众 不 同 ， 是 因为 我 们 不 断 倾听 读者 的 批评 和 建议 ， 我 们 自己 也 在 反复 实验 ， 
再 加 上 来 自发 行 渠 道 的 反馈 意见 ， 多 重 作 用 之 下 我 们 得 以 形成 自己 的 特色 。 与 众 不 同 的 封面 凸显 出 我 
们 对 技术 主题 的 独特 解读 方式 ,赋予 了 原本 枯燥 的 内 容 以 鲜 活 的 生命 力 和 个 性 。 

本 书 的 封面 动物 是 最 蜥 ( Agamid lizard )。 这 些 蜥 蝎 属 于 最 蜥 科 ， 物 种 多 达 300 多 个 。 最 蜥 广泛 见于 
非洲 、 亚 洲 、 澳 大 利 亚 和 南欧 ， 普 遍 具有 强壮 的 腿 部 ， 某 些 变 种 有 变色 能 力 。 不 像 其 他 的 蜥 蝎 ， 蜂 蜥 
的 尾巴 断 掉 后 不 会 重新 长 出 来 。 它 们 能 存活 于 多 种 环境 下 ， 从 干旱 的 沙漠 到 温暖 潮湿 的 热带 雨林 都 能 
生 见 它们 的 踪影 。 

部 分 品种 作为 宠物 十 分 受 大 家 欢迎 。 这 其 中 就 有 紧 狮 蜥 ( Bearded Dragon， 学 名 Pogona )。 它 们 性 情 
温和 ， 好 奇 心 强 ， 身 体 最 长 可 达 大 约 50 厘米 。 尽 管 身材 纤巧 ， 它 们 仍然 被 称 作 “巨型 ” 蜥 蝎 ， 也 需 
要 宽敞 的 生活 空间 。 雁 性 的 聂 狮 蜥 通常 具有 领地 意识 。 虽 然 它 们 具有 社会 性 ， 但 是 过 度 拥挤 的 环境 会 
邻 它们 感到 紧张 ， 尤 其 是 当 它 们 无 处 藏身 时 。 过 度 拥挤 也 会 引发 不 同 个 体 之 间 的 争斗 以 致 受伤 ， 争斗 
中 的 个 体 可 能 会 失去 脚趾 和 尾巴 ， 并 导致 食欲 不 振 。 

渗 狮 蜥 的 头 部 呈 三 角形 ， 下 巴 以 上 有 许多 突出 的 坏 状 鲜 。 这 些 棘 状 鲜 看 起 来 像 络 腮 胡子 (因此 而 得 
名 )。 在 其 身体 侧面 也 会 有 棘 状 鲜 。 紧 狮 蜥 会 张 开 嘴 展示 它们 尖锐 的 桥 须 以 吓 阻 敌 人 和 同类 。 它 们 也 
会 展 平 身体 ， 这 时 看 起 来 显得 更 大 。 作 为 宠物 ， 当 它们 面 对 主 人 并 感觉 舒适 安全 的 时 候 ， 也 可 能 会 收 
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限制 野生 动物 的 出 口 。 

飞 蜥 ( dracovolans ) 是 另 一 个 变种 。 体 长 不 超过 27 厘米 ， 身 体 顾 长 ， 肋 部 有 翼 膜 。 雄 性 往往 会 占据 
两 到 三 棵 树 作 为 领地 ， 每 棵 树 上 可 能 住 有 一 只 到 三 只 只 性 。 为 了 能 从 此 处 迅速 移动 到 彼 处 ， 它 会 从 树 
上 或 者 其 他 高 处 展开 翼 膜 滑翔 。 然 而 ， 它 们 通常 无 法 在 雨中 或 者 风 中 飞行 。 受 到 威胁 时 ， 飞 蜥 也 会 展 
开 翼 膜 ， 让 自己 看 起 来 更 大 一 些 。 

另 一 个 有 趣 的 变种 是 彩虹 飞 蜥 (Agama agama )， 见 于 撒哈拉 以 南非 洲 。 这 种 生物 常常 群居 ， 每 个 族 
群 10 只 到 20 只 不 等 ， 族 群 领袖 通常 为 年 长 的 雄性 。 晚 间 它 们 的 身体 呈现 黑 褐 色 ， 但 是 黎明 时 转 为 淡 
蓝 色 ， 头 部 和 尾部 呈现 出 鲜艳 的 橘 色 。 皮 肤 颜色 也 会 根据 情绪 发 生变 化 ， 就 像 一 只 虚拟 的 情绪 戒指 。 
例如 ， 雄 性 飞 王 时 ， 它 们 的 头 部 将 变 为 棕色 ， 身 体 上 则 出 现 白色 的 斑点 。 

本 书 的 责任 编辑 是 Darren Kelly，Kenneth Kimball 是 文字 编辑 ，Karmyn Guthrie 负责 校对 。nSight 公 
司 提 供 了 产品 服务 。Jamie Peppard 和 Genevieve d'Entremont 负责 品质 管理 。Jansen Fernald 提供 了 产 
品 支 持 。Beth Palmer 完成 了 索引 部 分 。 

Karen Montgomery 基于 Edie Freedman 的 一 系列 设计 作品 设计 出 了 本 书 的 封面 。 封 面 的 图 像 来 自 
Dover Pictorial Archive 的 一 幅 19 世纪 雕刻 作品 。Karen Montgomery 借助 Adobe InDesign CS 创作 了 封 
面 布 局 ， 并 使 用 到 了 Adobe 的 ITC Garamond 字体 。 


David Futato 设计 了 内 页 布局 。Keith Fahlgren 使 用 一 个 格式 转换 工具 把 本 书 的 内 容 转 换 至 
FrameMaker 5.5.6， 该 格式 转换 工具 由 Erik Ray, Jason McIntosh, Neil Walls 和 Mike Sierra 合作 完成 ， 
使 用 到 了 Perl 和 XML 技术 。 文 本 字体 是 Linotype Birka， 标 题字 体 是 Adobe Myriad Condensed， 代 码 
字体 是 LucasFont 的 Sans Mono Condensed。 书 中 的 插图 由 Robert Romano, Jessamyn Read 和 Lesley 
Borash 合作 完成 ， 他 们 用 到 了 Macromedia FreeHand MX 和 Adobe Photoshop CS. Christopher Bing 绘 
制 了 提示 和 警告 图 标 。Jansen Fernald 完成 了 本 书 末 尾 的 版 权 声 明 页 。 
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了 解 SQL 查询 语言 的 基本 原理 ， 但 仍 感觉 无 法 自由 运用 SQL? 想 在 数据 
上 线 前 用 SQL 跑 一 遍 数 据 库 ? 想 进一步 提高 SQL 技能 ? 
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m 与 层次 化 有 关 的 一 些 实例 
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